要求:1人1组,报告排除代码,2000字以上。
- 对某个研究方向调研相关的资料,形成比较全面深入的理解
Project
要求:允许三人一组
可以允许下述题目:
- 在内存中实现TPC-H中lineItem和orders两表连接功能(连接键为orderkey),分为
- 使用TPC-H工具生成数据(SF=1),并将对应数据全部加载至内存中(需要自定义数据结构存放数据)
- 实现多线程的Hash Join(限制4线程,你也可以跳过这一步)
- 使用多线程实现radix-join算法将两表数据进行连接(限制4线程)
- 使用软件预取(Software-Prefetch)和写合并缓冲(Software Write-Combine Buffers)技术优化连接算法(选择项,不强制要求)
结题形式:形成简单报告,经过老师检查
参考文献:
sigmod2016-An Experimental Comparison of Thirteen Relational.pdf
- 基于实验的Mini-OB实现Order By功能,分为
- 全部数据在内存中
- 内存放不下时的外部排序
结题方式:经过助教检查
- 自行拟定的课题,课题内容需要与老师商量,经同意后才行
结题方式:形成简单报告,经过老师检查
第一周