Intel近日更新了开源的C头文件库,正式支持AVX512SIMD指令集,相比此前的AVX2指令集,可以提供更高性能的SIMD排序。 基于AVX512指令集,C头文件库可以对16位、64位数据类型进行快速排序,实测在一套IntelTigerLake11代酷睿系统上,NumPyPython的性能提升了多达1017倍。 具体来说,16位数据排序性能提升了17倍,32位数据也有1213倍,64位浮点数据则可以提速10倍。 这证明,AVX512只要适配优化得当,带来的性能提升是十分显著的,而且不一定非得吃掉多高功耗。 不过,Intel1213代酷睿因为引入混合架构,不得不牺牲了AVX512,自然无法从中受益,AMDZen4架构的锐龙7000系列则首次加入了AVX512。 这就有点尴尬了。