首页 > 玄幻魔法 > 重生死胖子?一周逆袭成完美男神 > 第342章 开源即是王炸,全世界都开始使用江神的AI框架?

第342章 开源即是王炸,全世界都开始使用江神的AI框架?

⚡ 自动翻页 开启后阅读到底自动进入下一章
⚡ 开启自动翻页更爽 看到章尾自动进入下一章,追书不用一直点。

  “也是......人家连哥德巴赫猜想都能证明,区区一个ai框架算什么。”

  “话不能这么说,搞框架跟搞数学是两码事。tensorflow背后是股歌几千个工程师,江神一个人写的框架,真能打?”

  “能不能打,下载下来试试不就知道了。”

  “对!有没有兄弟已经跑了的?来说说使用体验!”

  “我跑了!公司显卡刚好空著,就拿mnist数据集试了一下。”

  “说真的,我到现在手还在抖……同样一个简单的卷积神经网络,用tensorflow训练要跑二十分钟,用stellaris只跑了两分钟。”

  “两分钟!而且训练过程中的內存占用不到tensorflow的四分之一!”

  “臥槽?真的假的?两分钟?你確定不是显卡问题?”

  “同样的硬体,同样的数据集,同样的网络结构,控制变量法懂不懂?就是框架的优化牛逼!而且我刚才又跑了个transformer,训练速度比pytorch快了將近八倍!八倍啊兄弟们!”

  “我作证!我也刚跑完bert的预训练,用tensorflow加四张显卡跑了整整两天一夜。”

  “刚才用stellaris试了一下,同样的数据量,只跑了不到五个小时就收敛了!中间还没崩过一次!全程稳如老狗!这效率简直离谱!”

  “五个小时?你是认真的吗?我之前训bert训了整整三天才勉强收敛,你五个小时就搞定了?”

  “骗你干嘛!github上已经有其他开发者在跑gpt架构的测试了,初步数据更夸张……同样的参数量,內存占用不到pytorch的三分之一,训练速度是pytorch的十倍以上。”

  “十倍!你知道这是什么概念吗?也就是说,以前要花半个月才能训完的大模型,现在一天就能跑完!”

  “臥槽......真的假的?这框架也太猛了吧?”