Schedule

Date: Friday, June 14

Location: Antártica room

Session 1, Chair: Abolfazl Asudeh

8:30 AM - 8:35 AM Opening Remarks
8:35 AM - 9:30 AM Keynote1: Steven Whang
9:30 AM - 9:45 AM Digging Up Threats to Validity: A Data Marshalling Approach to Sensitivity Analysis Anna Zeng (MIT), Michael Cafarella (MIT CSAIL)
9:45 AM - 10:00 AM Press ECCS to Doubt (Your Causal Graph) Markos Markakis (Massachusetts Institute of Technology), Ziyu Zhang (MIT), Rana Shahout (Harvard), Trinity Gao (MIT), Chunwei Liu (MIT), Ibrahim Sabek (University of Southern California), Michael Cafarella (MIT CSAIL) Best Workshop Paper
10:00 AM - 10:30 AM Coffee Break

Session 2, Panel Discussion

10:30 AM - 12:00 PM Panel: The Role of Data Management Research for Responsible AI with Steven Whang, Felix Naumann, Boris Glavic, Fatemeh Nargesian, Leopoldo Bertossi, and Ziawasch Abedjan
12:00 PM – 2:00 PM Lunch

Session 3, Chair: Sainyam Galhotra

2:00 PM - 3:00 PM Keynote2: Felix Naumann
3:00 PM - 3:15 PM CMDBench: A Benchmark for Coarse-to-fine Multimodal Data Discovery in Compound AI Systems Yanlin Feng (Megagon Labs), Sajjadur Rahman (Megagon Labs), Aaron Feng (Megagon Labs), Shuwei Chen (Megagon Labs), Eser Kandogan (Megagon Labs)
3:15 PM - 3:30 PM SET: Searching Effective Supervised Learning Augmentations in Large Tabular Data Repositories Jiaxiang Liu (Columbia University), Zezhou Huang (Columbia University), Eugene Wu (Columbia University)
3:30 PM - 4:00 PM coffee break

Session 4, Chair: Babak Salimi

4:00 PM - 4:15 PM The Generalized Causal-Effect Score in Data Management Leopoldo Bertossi (SKEMA Business School, Montreal, Canada)
4:15 PM - 4:30 PM Disambiguate Entity Matching using Large Language Models through Relation Discovery Zezhou Huang (Columbia University)
4:30 PM - 4:45 PM Threshold-Independent Fair Matching through Score Calibration Mohammad Hossein Moslemi (University of Western Ontario), Mostafa Milani (The University of Western Ontario)
4:45 PM - 5:00 PM Cost-Effective LLM Utilization for Machine Learning Tasks over Tabular Data Yael Einy (Tel Aviv University), Tova Milo (Tel Aviv University), Slava Novgorodov (Tel Aviv University)
5:00 PM - 5:15 PM On Integrating the Data-Science and Machine-Learning Pipelines for Responsible AI Armin Esmaeilzadeh (University of Nevada Las Vegas), Joel Rorseth (University of Waterloo), Andy Yu (University of Waterloo), Parke Godfrey (York University), Lukasz Golab (University of Waterloo), Divesh Srivastava (AT&T Chief Data Office), Jaroslaw Szlichta (York University and IBM CAS), kazem Taghva (The University of Nevada, Las Vegas)
5:15 PM - 5:30 PM Concluding Remarks

Recorded Presentation

TbExplain: A Text-Based Explanation Method for Scene Classification Models With the Statistical Prediction Correction Amirhossein Aminimehr (Iran University of Science and Technology), Pouya Khani (Aarhus University), Amirali Molaei (Iran University of Science and Technology)