![]() |
求助,越来越穷了,有没有老板给一些php开发单子做呀! |
ds为了计算效率将MHA换成了MLA,将MoE做一下小改动,MTP这个想法很不错,某种意义上算是降低n-gram的生成loss来保障生成内容的连贯性。ds的成功更大的体现在工程技术上的成功,一次完整的pre-training只需要500w刀。总的来说,现在的AI发展路径依然是通过使用更多的参数更深的网络去拟合更复杂的F(x),所谓的AGI概念更像是资本为了垄断搞出来的趋势,对于独立的问题领域来说,数据集是小的,模型自然也是小的,AI的路径更多的应该是如何调整模型结构和算法原理让模型用更少的参数习得数据里的pattern,这才是福泽万民的路。
过早客微信公众号:guozaoke • 过早客新浪微博:@过早客 • 广告投放合作微信:fullygroup50 鄂ICP备2021016276号-2 • 鄂公网安备42018502001446号