Program

06/09/2025 Monday

Time	Track A (Ballroom AB)	Track B (Ballroom C)
8:00-9:00	Breakfast
9:00-9:10	Opening
9:10-10:20	Keynote Talk (Ballroom AB) Supercomputing after Device Scaling Stops: Limits, Tradeoffs, and What Comes Next Mike O’Connor, Principal Research Scientist, NVIDIA
10:20-10:40	Coffee Break
10:40-12:00	Session: Approximation Chair: Wei Niu (University of Georgia) SYprox: Combining Host and Device Perforation with Mixed Precision Approximation on Heterogeneous Architectures Lorenzo Carpentieri:University of Salerno;Biagio Cosenza:University of Salerno BitWeaver: Read-Time Truncation in Memory Garrett Gagnon:Samsung Semiconductor US,Rensselaer Polytechnic Institute;Srikanth Malla:Samsung Semiconductor US;Yangwook Kang:Samsung Semiconductor US;Liu Liu:Rensselaer Polytechnic Institute NeurLZ: An Online Neural Learning-based Method to Enhance Scientific Lossy Compression Wenqi Jia:University of Texas at Arlington;Zhewen Hu:Texas A&M University;Youyuan Liu:Temple University;Boyuan Zhang:Indiana University;Jinzhen Wang:UNC Charlotte;Jinyang Liu:University of Houston;Wei Niu:University of Georgia;Stavros Kalafatis:Texas A&M University;Junzhou Huang:University of Texas at Arlington;Sian Jin:Temple University;Daoce Wang:Indiana University;Jiannan Tian:University of Kentucky;Miao Yin:University of Texas at Arlington ghZCCL: Advancing GPU-aware Collective Communications with Homomorphic Compression Jiajun Huang:University of South Florida, Sheng Di:Argonne National Laboratory, Yafan Huang:University of Iowa, Zizhong Chen:University of California Riverside, Franck Cappello:Argonne National Laboratory, Yanfei Guo:Argonne National Laboratory, Rajeev Thakur:Argonne National Laboratory	Session: Graph Neural Networks Chair: Ali Jannesari (Iowa State University) Scaling Large-scale GNN Training to Thousands of Processors on CPU-based Supercomputers Chen Zhuang:Institute of Science Tokyo,Riken Center for Computational Science;Lingqi Zhang:RIKEN Center for Computational Science;Du Wu:Institute of Science Tokyo,RIKEN Center for Computational Science;Peng Chen:RIKEN Center for Computational Science;Jiajun Huang:University of South Florida;Xin Liu:National Institute of Advanced Industrial Science & Technology;Rio Yokota:Institute of Science Tokyo;Nikoli Dryden:Lawrence Livermore National Laboratory;Toshio Endo:Institute of Science Tokyo;Satoshi Matsuoka:RIKEN Center for Computational Science,Institute of Science Tokyo;Mohamed Wahib:RIKEN Center for Computational Science CoLa: Towards Communication-efficient Distributed Sparse Matrix-Matrix Multiplication on GPUs (virtual) Lixing Zhang:Beijing University of Posts and Telecommunications;Yingxia Shao:Beijing University of Posts and Telecommunications;Shigang Li:Beijing University of Posts and Telecommunications Cherry: Breaking the GPU Memory Wall for Large-Scale GNN Training via Micro-Batching Yan Wang:Guangzhou Institute of Technology, Xidian University;Qinghua Guo:Guangzhou Institute of Technology, Xidian University;Haoran Kong:Institute of Computing Technology, Chinese Academy of Sciences;Kai Sheng:Guangzhou Institute of Technology, Xidian University;Zhen Xie:Binghamton University;Hao Chen:College of Computer Science and Electronic Engineering, Hunan University;Weile Jia:Institute of Computing Technology, Chinese Academy of Sciences;Dingwen Tao:Institute of Computing Technology, Chinese Academy of Sciences;Xin He:Guangzhou Institute of Technology, Xidian University Fused3S: Fast Sparse Attention on Tensor Cores Zitong Li:University of California, Irvine;Aparna Chandramowlishwaran:University of California, Irvine
12:00-1:40	Lunch (provided)
1:40-3:00	Session: Sparse Linear Algebra Chair: Kazem Cheshmi (McMaster University) StructILU: Dependency-Preserving Incomplete LU with Hierarchical Parallelism for Structured Grid PDEs on GPUs Hao Luo:Peking University;Qianchao Zhu:Peking University;Xiaochen Hao:School of Computer Science, Peking University;Chunxi Lei:Peking University;Chengdi Ma:Peking University;Chenchen Zhang:Peking University;Yun Liang:School of Integrated Circuits, Peking University;Chao Yang:Peking University,PKU-Changsha Institute for Computing and Digital Economy IA-Chol: Input-Aware Cholesky Decomposition on CPU and GPU (virtual) Jixiao Deng:National University of Defense Technology;Qinglin Wang:National University of Defense Technology;Lin Chen:National University of Defense Technology;Bo Yang:National University of Defense Technology;Xinhai Chen:National University of Defense Technology;Jie Liu:National University Of Defense Technology CB-SpMV:A Data Aggregating and Balance Algorithm for Cache-Friendly Block-Based SpMV on GPUs (virtual) Xing Cong:Beihang University;FuKai Sun:Beihang University;YiFan Chen:Beihang University;Chenhao Xie:Beihang University;Yi Liu:Beihang University;Depei Qian:Beihang University HR-SpMM: Adaptive Row Partitioning and Hybrid Kernel Design for Sparse Matrix Multiplication (virtual) Qi Wang:Southwest University of Science and Technology;Yaobin Wang:Southwest University of Science and Technology;Yi Luo:Southwest University of Science and Technology;Rong Luo:Southwest University of Science and Technology;Pingping Tang:Southwest University of Science and Technology	Session: Acceleration Chair: Antonia Zhai (University of Minnesota) G^3SA: A GPU-Accelerated Gold Standard Genomics Library for End-to-End Sequence Alignment Yeejoo Han:Seoul National University;Sunwoo Kim:Seoul National University;Seongyeon Park:Seoul National University;Jinho Lee:Seoul National University Graph Convolutional Network Acceleration Using Adiabatic Superconductor Josephson Devices Zhengang Li:Northeastern University;Hongwu Peng:University of Connecticut;Xuan Shen:Northeastern University;Masoud Zabihi:Northeastern University;Xi Xie:University of Connecticut;Geng Yuan:University of Georgia;Yanzhi Wang:Northeastern University;Olivia Chen:Kyushu University;Caiwen Ding:University of Minnesota Twin Cities TMModel: Modeling Texture Memory and Mobile GPU Performance to Accelerate DNN Computations Jiexiong Guan:University of Thessaly,William & Mary;Zhenqing Hu:William & Mary;Christos D. Antonopoulos:University of Thessaly;Nikolaos Bellas:University of Thessaly;Spyros Lalis:University of Thessaly;Evgenia Smirni:William & Mary;Gang Zhou:William & Mary;Gagan Agrawal:University of Georgia;Bin Ren:William & Mary DR-CircuitGNN: Training Acceleration of Heterogeneous Circuit Graph Neural Network on GPUs Yuebo Luo:University of Minnesota Twin Cities;Shiyang Li:University of Minnesota Twin Cities,Nankai University;Junran Tao:Stevens Institute of Technology;Kiran Gautam Thorat: University of Connecticut;Xi Xie: University of Connecticut;Hongwu Peng: University of Connecticut;Nuo Xu:University of Minnesota Twin Cities;Caiwen Ding:Department of Computer Science and Engineering , University of Minnesota Twin Cities;Shaoyi Huang:Stevens Institute of Technology
3:00-3:20	Coffee Break
3:20-5:20	Session: Applications Chair: Tsung-Wei Huang (University of Wisconsin-Madison) CLOVER: Spatio-graph-based kNN on the GPU Victor Kamel:University of Toronto;Hanxueyu Yan:University of Victoria;Sean Chester:University of Victoria Efficient Locality-aware Instruction Stream Scheduling for Stencil Computation on ARM Processors (virtual) Shanghao Liu:Beihang University;Hailong Yang:Beihang University;Xin You:Beihang University;Zhongzhi Luan:Beihang University;Yi Liu:Beihang University;Depei Qian:Beihang University Accelerating Complex Stencil Computations with Adaptive Fusion Strategy (virtual) Siqi Wang:Beihang University;Hailong Yang:Beihang University;Pengbo Wang:Beihang University;Shaokang Du:Beihang University;Yufan Xu:Independent Researcher;Qingxiao Sun:China University of Petroleum, Beijing;Xiaoyan Liu:Beihang University;Xuezhu Wang:Beihang University;Xuning Liang:Beihang University;Zhongzhi Luan:Beihang University;Yi Liu:Beihang University;Depei Qian:Beihang University A3FR: Agile 3D Gaussian Splatting with Incremental Gaze Tracked Foveated Rendering in Virtual Reality Shuo Xin:Physics, Stanford University;Haiyu Wang:Tandon School of Engineering, New York University;Sai Qian Zhang:Tandon School of Engineering, New York University EPIClear: Exploiting Domain-Specific Features for Epistasis Detection Acceleration on Tensor Cores Ricardo Nobre:INESC-ID, Instituto Super ior Técnico, Universidade de Lisboa;Miguel Graça:INESC-ID, Instituto Superior Técnico, Universidade de Lisboa;Leonel Sousa:INESC-ID, Instituto Superior Técnico, Universidade de Lisboa;Aleksandar Ilic:INESC-ID, Instituto Superior Técnico, Universidade de Lisboa Statistical Treatment of Variable MPI Latencies and MPI-Communication Hiding for Matrix-Free Finite Element Operators Max Heldman:Virginia Tech;Johann Rudi:Virginia Tech;Julie Bessac:Computational Science Center, National Renewable Energy Laboratory	Session: GPU Scheduling Chair: Dimitrios Nikolopoulos (Virginia Tech) Fast and Fair Training for Deep Learning in Heterogeneous GPU Clusters Zizhao Mo:University of Macau;Huanle Xu:University of Macau;Wing Cheong Lau:The Chinese University of Hong Kong SortingHat: System Topology-aware Scheduling of Deep Neural Network Models on Multi-GPU Systems Seok Namkoong:Yonsei University;Taehyeong Park:Yonsei University;Kiung Jung:Yonsei University;Jinyoung Kim:Yonsei University;Yongjun Park:Yonsei University CTCCL: Cost-Efficient Joint Device-Network Load Balancing for LLM Training in RoCE-based Intelligent Computing Network (virtual) Zhuotong Li:State Cloud, China Telecom;Liang Xu:State Cloud, China Telecom;Ziqi Huang:State Cloud, China Telecom;Shuyun Qian:State Cloud, China Telecom;Hongwei Bu:State Cloud, China Telecom;Ming Yang:State Cloud, China Telecom;Mengyun Luan:State Cloud, China Telecom;Weiguo Chen:State Cloud, China Telecom;Xu Wen:State Cloud, China Telecom Cephalo: Harnessing Heterogeneous GPU Clusters for Training Transformer Models Runsheng Benson Guo:Cheriton School of Computer Science, University of Waterloo;Utkarsh Anand:Cheriton School of Computer Science, University of Waterloo;Arthur Chen:Cheriton School of Computer Science, University of Waterloo;Khuzaima Daudjee:Cheriton School of Computer Science, University of Waterloo A Device-Side Execution Model for Multi-GPU Task Graphs Ilyas Turimbetov:Koç University;Mohamed Wahib:RIKEN Center for Computational Science;Didem Unat:Koç University

06/10/2025 Tuesday

Time	Track A (Ballroom AB)	Track B (Ballroom C)
8:00-9:00	Breakfast
9:00-10:20	Session: Solvers & Sparsity Chair: In-Saeng Suh (ORNL) CRAMG: A Communication-Reduced Algebraic Multigrid Method (virtual) Fan Yuan:School of Mathematics and Computer Science, Xiangtan University;Xiaojian Yang:National University of Defense Technology;Yunqing Huang:School of Mathematics and Computer Science, Xiangtan University;Dezun Dong:National University of Defense Technology;Chuanfu Xu:National University of Defense Technology;Jie Liu:National University of Defense Technology;Xiaoqiang Yue:School of Mathematics and Computer Science, Xiangtan University;Shengguo Li:National University of Defense Technology;Hongxia Wang:Department of Mathematics, National University of Defense Technology An Efficient 2D Fusion Method for High-Performance Two-Stage Eigensolvers on Modern Heterogeneous Architectures Yongxiao Zhou:Tsinghua University;Yi Zong:Tsinghua University;Yuyang Jin:Tsinghua University;Heng Li:Tsinghua University;Wei Xue:Tsinghua University, Beijing, China; Qinghai University, Xining, China SnuSOLVER: Optimizing Sparse Direct Solvers for Heterogeneous Systems Chaewon Kim:Department of Seoul National University;Jaehwan Lee:Department of Seoul National University;Jinpyo Kim:Department of Seoul National University;Dohyun Kim:Institute of Computer Technology, Seoul National University;Kyusu Ahn:Department of Data Science, Seoul National University,Research Center, Samsung Display Co., Ltd.;Hyung Uk Cho:Research Center, Samsung Display Co., Ltd.;Seungin Baek:Research Center, Samsung Display Co., Ltd.;Jaejin Lee:Dept. of Data Science, Seoul National University,Dept. of Seoul National University MAGNUS: Generating Data Locality to Accelerate Sparse Matrix-Matrix Multiplication on CPUs Jordi Wolfson-Pou:Intel Labs;Jan Laukemann:Friedrich-Alexander-Universität Erlangen-Nürnberg;Fabrizio Petrini:Intel Labs	Session: Processing-in-Memory Chair: Ioannis Sourdis (Chalmers University of Technology) PIM-CARE: A Compiler-Assisted Dynamic Resource Allocation Framework for Real-world DRAM PIM Inyong Hwang:Yonsei University;Donghyeon Kim:Hanyang University;Seokwon Kang:Yonsei University;Taehyeong Park:Yonsei University;Taehoon Kim:Hanyang University;Jiwon Seo:Seoul National University;Hanjun Kim:Yonsei University;Youngsok Kim:Yonsei University;Yongjun Park:Yonsei University Proteus: Achieving High-Performance Processing-Using-DRAM via Dynamic Precision Bit-Serial Arithmetic Geraldo Francisco de Oliveira Junior: ETH Zurich, mayank kabra: International institute of information technology Banglore, Yuxin Guo: Cambridge University, Kangqi Chen: ETH Zurich, Abdullah Giray Yaglikci: ETH Zurich, Melina Soysal: ETH Zurich, Mohammad Sadrosadati: ETH Zürich, Joaquin Olivares Bueno: Universidad de Córdoba, Saugata Ghose: University of Illinois Urbana-Champaign, Juan Gomez Luna: NVIDIA, Onur Mutlu: ETH Zurich SparsePIM: An Efficient HBM-Based PIM Architecture for Sparse Matrix-Vector Multiplications Taewoon Kang:Korea University;Geonwoo Choi:Korea University;Taeweon Suh:Korea University;Gunjae Koo:Korea University MARS: Processing-In-Memory Acceleration of Raw Signal Genome Analysis Inside the Storage Subsystem Melina Soysal: ETH Zurich, Konstantina Koliogeorgi: ETH Zurich, Can Firtina: ETH Zurich, Nika Mansouri Ghiasi: ETH Zurich, Rakesh Nadig: ETH Zurich, Haiyu Mao: ETH Zurich, Geraldo Francisco de Oliveira Junior: ETH Zurich, Yu Liang: ETH Zurich, Klea Zambaku: ETH Zurich Bilkent University, Mohammad Sadrosadati: ETH Zürich, Onur Mutlu: ETH Zurich
10:20-10:40	Coffee Break
10:40-12:00	Session: Efficiency Chair: Xiaoyi Lu (UC Merced) DALdex: A DPU-Accelerated Persistent Learned Index via Incremental Learning (virtual) Aoyang Tong:Huazhong University of Science and Technology;Yu Hua:Huazhong University of Science and Technology;Menglei Chen:Huazhong University of Science and Technology From Islands to Archipelago: Towards Collaborative and Adaptive Burst Buffer for HPC Systems (virtual) Mingtian Shao:National University of Defense Technology;Ruibo Wang:National University of Defense Technology;Wenzhe Zhang:National University of Defense Technology;Kai Lu:National University of Defense Technology;Yiqin Dai:National University of Defense Technology;Huijun Wu:National University of Defense Technology PIE: Enabling Fast and Scalable Incremental Evolving Graph Analytics on Persistent Memory Yunmo Zhang:City University of Hong Kong;Jiacheng Huang:City University of Hong Kong;Xizhe Yin:University of California Riverside;Junqiao Qiu:City University of Hong Kong;Hong Xu:The Chinese University of Hong Kong;Chun Jason Xue:MBZUAI DEDUPKV: A Space-Efficient and High-Performance Key-Value Store via Fine-Grained Deduplication Safdar Jamil:Sogang University;Awais Khan:Oak Ridge National Lab;Xubin He:Temple University;Youngjae Kim:Sogang University	Session: Optimizing Compilation Chair: Gagan Agrawal (University of Georgia) ConTraPh: Contrastive Learning for Parallelization and Performance Optimization Quazi Ishtiaque Mahmud:Iowa State University;Ali TehraniJamsaz:Iowa State University;Nesreen K. Ahmed:Cisco AI Research ;Theodore L. Willke:DataStax;Ali Jannesari:Iowa State University UJOpt: Heuristic Approach for Applying Unroll-and-Jam Optimization and Loop Order Selection Shilpa Babalad:Indian Institute of Science;Shirish K Shevade:Indian Institute of Science;Matthew Jacob Thazhuthaveetil:Indian Institute of Science;R Govindarajan:Indian Institute of Science Loop Fusion in Matrix Multiplications with Sparse Dependence Kazem Cheshmi:McMaster University;Mohammad Mehdi Salehi:McMaster University ConCo: Optimizing Compilation of Concurrent Tensor Programs on Shared GPU (virtual) Jiamin Lu:University of Science and Technology of China;Jingwei Sun:University of Science and Technology of China;Yunlong Xu:Independent Researcher;Peng Sun:Independent Researcher;Guangzhong Sun:University of Science and Technology of China
12:00-1:40	Lunch (provided)
1:40-3:40	Session: Best Papers (Ballroom AB) Chair: Xipeng Shen (NC State University) Pushing the Limits of GPU Lossy Compression: A Hierarchical Delta Approach Boyuan Zhang:Indiana University;Yafan Huang:University of Iowa;Sheng Di:Argonne National Laboratory;Fengguang Song:Indiana University;Guanpeng Li:University of Iowa;Franck Cappello:Argonne National Laboratory Parallel Contraction Hierarchies Can Be Efficient and Scalable Zijin Wan:University of California, Riverside;Xiaojun Dong:University of California, Riverside;Letong Wang:University of California, Riverside;Enzuo Zhu:University of California, Davis;Yan Gu:University of California, Riverside;Yihan Sun:University of California, Riverside BMQSim: Overcoming Memory Constraints in Quantum Circuit Simulation with a High-Fidelity Compression Framework Boyuan Zhang:Indiana University;Bo Fang:Pacific Northwest National Laboratory;Fanjiang Ye:Indiana University;Luanzheng Guo:Pacific Northwest National Laboratory;Fengguang Song:Indiana University;Nathan Tallent:Pacific Northwest National Laboratory;Dingwen Tao:Indiana University DIV: An Index & Value compression method for SpMV on large matrices Dimitrios Galanopoulos:National Technical University of Athens;Panagiotis Mpakos:National Technical University of Athens;Petros Anastasiadis:National Technical University of Athens;Nectarios Koziris:National Technical University of Athens;Georgios Goumas:National Technical University of Athens DIMPLES: Distributed Influence Maximization for Pandemic pLanning on Exascale Systems Marco Minutoli:Pacific Northwest National Laboratory;Reece Neff:North Carolina State University;Naw Safrin Sattar:Oak Ridge National Laboratory;Hao Lu:Oak Ridge National Laboratory;John Feo:Pacific Northwest National Laboratory;Henning Mortveit:University of Virginia;Anil Vullikanti:University of Virginia;Dawen Xie:University of Virginia;Mandy L Wilson:University of Virginia;Gregor von Laszewski:University of Virginia;Parantapa Bhattacharya:University of Virginia;S M Ferdous:Pacific Northwest National Laboratory;Ananth Kalyanaraman:Washington State University;Michela Becchi:North Carolina State University;Madhav Marathe:University of Virginia;Mahantesh Halappanavar:Pacific Northwest National Laboratory Light-FP: Analyze Floating-Point Error in a Highly Condensed Approach (virtual) Jiazhi Mi:Institute of Computing Technology, Chinese Academy of Sciences,University of Chinese Academy of Sciences;Li Chen:Institute of Computing Technology, Chinese Academy of Sciences,Laboratory for Advanced Computing and Intelligence Engineering;Haoyu Wang:Institute of Computing Technology, Chinese Academy of Sciences,University of Chinese Academy of Sciences;Ruixiang Gao:Shandong University of Science and Technology;Hongze Zhang:Shandong University of Science and Technology;Ronghong Shen:Institute of Computing Technology, Chinese Academy of Sciences,University of Chinese Academy of Sciences;Kai Lin:Beijing Institute of Technology;You Fu:Shandong University of Science and Technology;Huimin Cui:Institute of Computing Technology, Chinese Academy of Sciences,University of Chinese Academy of Sciences
5:00-10:00	Excursion and dinner at Red Butte Garden (https://redbuttegarden.org) Buses will run every 15 minutes to Red Butte Garden between 5-6pm, from the Guest House as well as Downtown (200 E 200 S)

06/11/2025 Wednesday

Time	Track A (Ballroom AB)	Track B (Ballroom C)
8:00-9:00	Breakfast
9:00-10:20	Session: Performance Analysis Chair: Jason Liu (Florida International University) WisIO: Automated I/O Bottleneck Detection with Multi-Perspective Views for HPC Workflows Izzet Yildirim:Illinois Institute of Technology;Hariharan Devarajan:Lawrence Livermore National Laboratory;Anthony Kougkas:Illinois Institute of Technology;Xian-He Sun:Illinois Institute of Technology;Kathryn Mohror:Lawrence Livermore National Laboratory Efficient Server Consolidation through a balanced mix of Transformer-based and Conventional Applications Pablo Abad:Universidad de Cantabria;Pablo Prieto:Universidad de Cantabria;Valentin Puente:Universidad de Cantabria;Jose Angel Gregorio:Universidad de Cantabria Taking GPU Programming Models to Task for Performance Portability Joshua Hoke Davis:University of Maryland;Pranav Sivaraman:University of Maryland;Joy Kitson:University of Maryland;Konstantinos Parasyris:Lawrence Livermore National Laboratory;Harshitha Menon:Lawrence Livermore National Laboratory;Isaac Minn:University of Maryland;Giorgis Georgakoudis:Lawrence Livermore National Laboratory;Abhinav Bhatele:University of Maryland Analyzing the Performance of Applications at Exascale Dragana Grbic:Rice University;John Mellor-Crummey:Rice University	Session: Heterogeneity Chair: Abdullah Muzahid (Texas A&M Univ) Understanding the Idiosyncrasies of Emerging BlueField DPUs Arjun Kashyap:University of California, Merced;Yuke Li:University of California, Merced;Darren Ng:University of California, Merced;Xiaoyi Lu:University of California, Merced Multi-node Multi-GPU Datalog Ahmedur Rahman Shovon:University of Illinois Chicago;Yihao Sun:Syracuse University;Kristopher Micinski:Syracure University;Thomas Gilray:Washington State University;Sidharth Kumar:University of Illinois Chicago SmartNIC-GPU-CPU Heterogeneous System for Large Machine Learning Model with Software-Hardware Codesign Anqi Guo: Boston University;Yuchen Hao:Meta Platforms;Xiteng Yao: Boston University;Shining Yang:Boston University;Jianyu Huang:Meta Platforms;Tony (Tong) Geng:Department of Electrical and Computer Engineering, University of Rochester;Martin Herbordt: Boston University D-Rex: Heterogeneity-Aware Reliability Framework and Adaptive Algorithms for Distributed Storage Maxime Gonthier:University of Chicago,Argonne National Laboratory;Dante D. Sanchez-Gallegos:University Carlos III of Madrid;Haochen Pan:University of Chicago;Bogdan Nicolae:Argonne National Laboratory;Sicheng Zhou:Southern University of Science and Technology;Hai Duc Nguyen:University of Chicago ,Argonne National Laboratory;Valerie Hayot-Sasson:University of Chicago,Argonne National Laboratory;J. Gregory Pauloski:University of Chicago;Jesus Carretero:University Carlos III of Madrid;Kyle Chard:University of Chicago,Argonne National Laboratory;Ian Foster:University of Chicago,Argonne National Laboratory
10:20-10:40	Coffee Break
10:40-12:00	Session: Resource Management Chair: Varun Shankar (University of Utah) ORION: Optimizing OLAP Query Execution with Proactive Caching and Separate Operators (virtual) Zhixin Tong:Shanghai Jiao Tong University;Jiuchen Shi:Shanghai Jiao Tong University,The Hong Kong Polytechnic University;Quan Chen:Shanghai Jiao Tong University;Pu Pang:Shanghai Jiao Tong University;Shixuan Sun:Shanghai Jiao Tong University;Jie Meng:Huawei Cloud;Jiang Liu:Huawei Cloud;En Shao:Institute of Computing Technology, Chinese Academy of Sciences;Minyi Guo:Shanghai Jiao Tong University ORA: Job Runtime Prediction for High-Performance Computing Platforms Using the Online Retrieval-Augmented Language Model (virtual) Hongyi Liu:Peking University;Yinping Ma:Peking University;Xiaosong Huang:Peking University;Lingzhe Zhang:Peking University;Tong Jia:Peking University,National Key Laboratory of Data Space Technology and System;Ying Li:Peking University Generating Microservice Graphs with Production Characteristics for Efficient Resource Scaling (virtual) Fanrong Du:Shanghai Jiao Tong University;Jiuchen Shi:Shanghai Jiao Tong University,The Hong Kong Polytechnic University;Quan Chen:Shanghai Jiao Tong University;Pu Pang:Shanghai Jiao Tong University;Li Li:Shanghai Jiao Tong University;Minyi Guo:Shanghai Jiao Tong University HARNESS: Holistic Resource Management for Diversely Scaled Edge Cloud Systems Ismet Dagli:Colorado School of Mines;Justin Davis:Colorado School of Mines;Mehmet Esat Belviranli:Colorado School of Mines	Session: Code Optimization Chair: Jinsung Kim (Chung-Ang University) Leonid: Exploring Automated Kernel Fusion in Performance-Portable Programming Models for Scientific Computation Chenchen Zhang:Peking University;Hao Luo:Peking University;Chao Yang:Peking University DeCOS: Data-Efficient Reinforcement Learning for Compiler Optimization Selection Ignited by LLM Tianming Cui:University of Minnesota;Pen-Chung Yew:University of Minnesota;Stephen McCamant:University of Minnesota;Antonia Zhai:University of Minnesota Pearl: Automatic Code Optimization Using Deep Reinforcement Learning (virtual) Djamel Rassem Lamouri:New York University Abu Dhabi;Iheb Nassim Aouadj:New York University Abu Dhabi;Smail Kourta:New York University Abu Dhabi;Riyadh Baghdadi:New York University Abu Dhabi CIExplorer: Microarchitecture-Aware Exploration for Tightly Integrated Custom Instruction (virtual) Xiaoyu Hao:University of Science and Technology of China;Sen Zhang:University of Science and Technology of China;Liang Qiao:University of Science and Technology of China;Qingcai Jiang:University of Science and Technology of China;Jun Shi:University of Science and Technology of China;Junshi Chen:University of Science and Technology of China,Laoshan Laboratory;Hong An:University of Science and Technology of China,Laoshan Laboratory;Xulong Tang:University of Pittsburgh;Hao Shu:NIO;Honghui Yuan:NIO
12:00-1:40	Lunch (provided)
1:40-3:00	Session: Energy & Servers Chair: Ponnuswamy Sadayappan (University of Utah) EVeREST-C: An Effective and Versatile Runtime Energy Saving Tool for CPUs Anna Yue:University of Minnesota;Pen-Chung Yew:University of Minnesota;Sanyam Mehta:Hardware-software Codesign,Hewlett-Packard Labs EDAN: Towards Understanding Memory Parallelism and Latency Sensitivity in HPC Siyuan Shen:ETH Zürich, Switzerland;Mikhail Khalilov:ETH Zürich, Switzerland;Lukas Gianinazzi:ETH Zürich, Switzerland;Timo Schneider:ETH Zürich, Switzerland;Marcin Chrapek:ETH Zürich, Switzerland;Jai Dayal:Cerebras Systems;Manisha Gajbe:N/A;Robert Wisniewski:Hewlett Packard Enterprise;Torsten Hoefler:ETH Zürich, Switzerland ROCKET: An RNS-based Photonic Accelerator for High-Precision and Energy-Efficient DNN Training (virtual) Hao Zhang:University of Otago;Haibo Zhang:University of Otago;Chengpeng Xia:University of Otago;Zhiyi Huang:University of Otago;Yawen Chen:University Of New South Wales;Amanda Barnard:Australian National University A Global Perspective on Supercomputer Power Provisioning: Case Studies from United States and Europe Tapasya Patki:Lawrence Livermore National Laboratory;Barry Rountree:Lawrence Livermore National Laboratory;Torsten Wilde:Hewlett-Packard Enterprise;Andrea Bartolini:University of Bologna;Stephanie Brink:Lawrence Livermore National Laboratory;Esa Heiskanen:CSC IT Center for Science Ltd.;Sachin Idgunji:NVIDIA Corporation;Matthias Maiterth:Oak Ridge National Laboratory;James Rogers:Oak Ridge National Laboratory;Ermal Rrapaj:Lawrence Berkeley National Laboratory;Ralf Schneider:HLRS High Performance Computing Center Stuttgart;Woong Shin:Oak Ridge National Laboratory;Kathleen Shoga:Lawrence Livermore National Laboratory;Christian Simmendinger:Hewlett-Packard Enterprise;Nicholas J. Wright:Lawrence Berkeley National Laboratory;Zhengji Zhao:Lawrence Berkeley National Laboratory	Session: Potpourri Chair: Jinsung Kim (Chung-Ang University) PortFC: Designing High-performance Deadlock-free BCube Networks Peirui Cao:Nanjing University;Rui Ning:Nanjing University;Hongwei Yang: China Mobile;Zhaochen Zhang:Nanjing University;Chang Liu:Nanjing University;Rui Li:Nanjing University;Yongqi Yang:Nanjing University;Yunzhuo Liu:Nanjing University;Chengyuan Huang:Nanjing University;Tao Sun: China Mobile;Xiaodong Duan: China Mobile;Guihai Chen:Nanjing University;Chen Tian:Nanjing University Auto-Healer: Self-Healing Hardware for Perception Stage Faults in Autonomous Driving Systems Ali Suvizi:George Washington University;Guru Venkataramani:George Washington University OpaQue: Program Output Obfuscation for Quantum Software Circuits in Quantum Clouds Tirthak Patel:Rice University;Aditya Ranjan:Northeastern University;Daniel Silver:Northeastern University;Harshitta Gandhi:QBit Solutions Research;William Cutler:Oxford University;Devesh Tiwari:Northeastern University JBSA: A Bit-Serial Accelerator for Deep Neural Networks Using Superconducting SFQ Logic (virtual) Yang Su:ShanghaiTech University; Shanghai Innovation Center for Processor Technologies;Sheng Li:ShanghaiTech University; Shanghai Innovation Center for Processor Technologies;Huilong Jiang:State Key Lab of Processors, Institute of Computing Technology, CAS;Haofei Yin:ShanghaiTech University; Shanghai Innovation Center for Processor Technologies;Rongliang Fu:The Chinese University of Hong Kong;Junying Huang:State Key Lab of Processors, Institute of Computing Technology, CAS;Xiaochun Ye:State Key Lab of Processors, Institute of Computing Technology, CAS;Zhimin Zhang:State Key Lab of Processors, Institute of Computing Technology, CAS;Jie Ren:State Key Laboratory of Functional Materials for Informatics, Shanghai Institute of Microsystem and Information Technology, CAS; University of Chinese Academy of Sciences ;Xiaoping Gao:State Key Laboratory of Functional Materials for Informatics, Shanghai Institute of Microsystem and Information Technology, CAS;Tsung-Yi Ho:The Chinese University of Hong Kong;Dongrui Fan:State Key Lab of Processors, Institute of Computing Technology, CAS; University of Chinese Academy of Sciences
3:20-5:00	Session: Graph Algorithms Chair: Seung-Hwan Lim (Oak Ridge National Laboratory) YH-Light: Yielding Hierarchy-aware Partitioner for Large-scale Graph Processing (virtual) Xinbiao Gan:National University of Defense technology;Tiejun Li:National University of Defense Technology;Chunye Gong:National University of Defense Technology;Jie Liu:National University Of Defense Technology;Kai Lu:National University of Defense Technology MG-aGCD: Accelerating Graph Community Detection on Multi-GPU Platforms (virtual) Shuai Yang:University of Chinese Academy of Sciences,Institute of Software, Chinese Academy of Sciences;Changyou Zhang:University of Chinese Academy of Sciences,Institute of Software, Chinese Academy of Sciences GraCFL: A Versatile Vertex-Centric Graph System for High-Performance CFL Reachability Analysis Sakib Fuad:University of California, Riverside;Amir Hossein Nodehi Sabet:University of California, Riverside;Umar Farooq:University of California, Riverside;Zhijia Zhao:University of California, Riverside OPMOS: Ordered Parallel Algorithm for Multi-Objective Shortest-Paths Leo Gold:University of Connecticut;Adam Bienkowski:University of Connecticut;David Sidoti:US Naval Research Laboratory;Krishna Pattipati:University of Connecticut;Omer Khan:University of Connecticut A Multi-GPU Algorithm for Computing Maximal Independent Sets in Large Graphs Anju Mongandampulath Akathoott:Texas State University;Benila Virgin Jerald Xavier:Texas State University;Martin Burtscher:Texas State University	Session: Memory Systems Chair: Mike Ferdman (Stony Brook University) A Cost-Effective Dueling Framework for Set-Associative Cache Indexing Kevin Weston:Texas A&M University;Vahid Janfaza:Texas A&M University;Avery Johnson:Texas A&M University;Abdullah Muzahid:Texas A&M University DREAM: Device-Driven Efficient Access to Virtual Memory Nurlan Nazaraliyev:University of California, Riverside;Elaheh Sadredini:UC Riverside;Nael Abu-Ghazaleh:Computer Science and Engineering , University of California, Riverside Page Migration for Hardware Memory Disaggregation Across a Network Archit Patke:University of Illinois at Urbana-Champaign;Christian Pinto:IBM Research Europe;Saurabh Jha:IBM Research;Haoran Qiu:University of Illinois at Urbana-Champaign;Zbigniew Kalbarczyk:University of Illinois at Urbana-Champaign;Ravishankar K. Iyer:University of Illinois at Urbana-Champaign MEMPLEX: A Memory System with Replication and Migration of Data for Multi-Chiplet NUMA Architectures Neethu Bal Mallya: Chalmers University of Technology and University of Gothenburg;Bhavishya Goel: Chalmers University of Technology and University of Gothenburg;Ioannis Sourdis: Chalmers University of Technology and University of Gothenburg Persistent Memory Objects on the Cheap Derrick Greenspan: University of Central Florida;Naveed Ul Mustafa:New Mexico State University;Jongouk Choi: University of Central Florida;Mark Heinrich: University of Central Florida;Yan Solihin: University of Central Florida