第342章 开源即是王炸,全世界都开始使用江神的AI框架?
  “也是......人家连哥德巴赫猜想都能证明,区区一个ai框架算什么。”
  “话不能这么说,搞框架跟搞数学是两码事。tensorflow背后是股歌几千个工程师,江神一个人写的框架,真能打?”
  “能不能打,下载下来试试不就知道了。”
  “对!有没有兄弟已经跑了的?来说说使用体验!”
  “我跑了!公司显卡刚好空著,就拿mnist数据集试了一下。”
  “说真的,我到现在手还在抖……同样一个简单的卷积神经网络,用tensorflow训练要跑二十分钟,用stellaris只跑了两分钟。”
  “两分钟!而且训练过程中的內存占用不到tensorflow的四分之一!”
  “臥槽?真的假的?两分钟?你確定不是显卡问题?”
  “同样的硬体,同样的数据集,同样的网络结构,控制变量法懂不懂?就是框架的优化牛逼!而且我刚才又跑了个transformer,训练速度比pytorch快了將近八倍!八倍啊兄弟们!”
  “我作证!我也刚跑完bert的预训练,用tensorflow加四张显卡跑了整整两天一夜。”
  “刚才用stellaris试了一下,同样的数据量,只跑了不到五个小时就收敛了!中间还没崩过一次!全程稳如老狗!这效率简直离谱!”
  “五个小时?你是认真的吗?我之前训bert训了整整三天才勉强收敛,你五个小时就搞定了?”
  “骗你干嘛!github上已经有其他开发者在跑gpt架构的测试了,初步数据更夸张……同样的参数量,內存占用不到pytorch的三分之一,训练速度是pytorch的十倍以上。”
  “十倍!你知道这是什么概念吗?也就是说,以前要花半个月才能训完的大模型,现在一天就能跑完!”
  “臥槽......真的假的?这框架也太猛了吧?”