预测token速度翻番!Transformer新解码算法
预测token速度翻番!Transformer新解码算法火了,来自小羊驼团队|代码已开源
https://www.qbitai.com/2023/11/100907.html
https://github.com/hao-ai-lab/LookaheadDecoding
评论:好像确实有用,两倍并行计算量换1.6倍速度提升,主要贡献感觉还是德国这篇文章parrallel decodinghttps://github.com/teelinsan/parallel-decoding 这次的团队(UCB、UCSD、CMU的学生https://lmsys.org/about/)主要是加了个2-gram方法(是不是还能3-gram下去,不过他也提到边际效益递减了)
今日关注说明,包括热点、论文
热点参考:https://openi.cn/hotnews/ 的热榜
论文参考:huggingface的每日论文:https://huggingface.co/papers
discord频道论文推荐:https://discord.com/channels/999382051935506503/1123614044637642832