“你們怎麼看?”
黃仁勳的話音剛落,就有一個聲音傳出來:“我覺得純扯!”
說話的是英偉達高級技術官,克裡斯·馬拉喬夫斯基,他接著這麼說道:“將小參數AI模型作為決策核心替代原本自由的神經網絡節點,在理論上就不可能行得通。”
“如果說原本的模型是一個線團,我們跑的很順,像這麼一搞,完全成了一團亂麻了!
“訓練效率不僅得不到提升,還造成了極大的困惱,就我目前的測試而言,百萬參數模型訓練時的損失已經高達0%。
“而且,模型越大,損失也越大。到GPT的水準,能損失到隻剩千分之一不到。
“換句話說,如果要用這種方式訓練GPT,要消耗原本一千倍的算力資源!什麼狗屁的死思考模型?將一萬個小參數模型放一起,就類比人了?扯淡吧!”
克裡斯聽起來怨氣頗深,自從卷耳智能科技的一百二十多項專利申請披露以來,克裡斯這幾天那是沒有睡過一個好覺,彆說類思維了,他感覺自己都快沒有思維了。
不過,他得出的結論跟黃仁勳的想法是不謀而合的。
“可是耳語……”但一提到耳語,他們又都沉默了。
因為耳語事實存在,效果他們都看到了,那麼就一定存在一個方案能夠做到。是選擇相信紀弘的一番亂扯,還是繼續無頭蒼蠅一般的亂撞,都不是一個好的選擇。
“還是要做!我們彆無選擇不是嗎?”黃仁勳如此說道。
“我們隻是硬件供應商,這些東西讓搞AI的頭疼去不行嗎?”克裡斯如此說道:
“你現在不是在中國嗎?是否考慮去見一見卷耳智能科技的創始人,論GPU,全世界沒有任何一家公司能比得上我們,這不是天然的合作者嗎?”
克裡斯是葡萄牙人,他不懂國人的思維,而黃仁勳是懂一些的,心裡也是不斷的搖頭,如果有可能,他早就去了。
但卷耳智能科技第一個找上摩爾科技的時候他就知道,英偉達肯定是沒戲的。倒不如指望OpnAI能夠知恥而後勇,趕緊趕上來。
“不過還是去見見吧,就算不成,也沒有什麼損失不是嗎?”黃仁勳尋思,來都來了,這裡離河州也不算太遠。
……
彆說英偉達這種業內企業了,就算是八竿子打不著的網友們,這個夜晚也都選擇不眠。
時間已是深夜,科技圈還熱鬨的很,簡直就像過大年。
而“今年”的“春晚”隻有一個主角,那就是類思維模型。
“一百多項專利我全都整理了,紀大在河州大學智算中心項目的啟動儀式上講的那番話,我也反複琢磨過。
“據此,我設計了一套實施方案【從0開始訓練一套類思維大模型】,源程序上傳到Git碼雲上了,地址是::‖git.|cla*****king。有興趣的可以下載下來一起試試,共同探討。”
“我試了,根本不行啊,這效率,還不如直接從0搭建GPT呢!”
“你廢話,專利文件肯定不可能給你披露細節的,這需要你一點點一點點的慢慢去試去調整,才能達到最佳。”
“能達到嗎?我怎麼覺得這就是個坑呢?我用數學模型做了一下評估,所有條件都考慮進去,看多少參數的小模型替代神經網絡節點,結果是多少你們知道嗎?答案是。”
專業的IT社區都是業內人士,尤其是今天,CDNBlog人工智能分區更是一群AI領域大佬的聚集地。
答案是代表什麼意思,他們再明白不過了——那就是現有神經網絡模型的效率就是最高的,任何改變都隻會影響效率,而不會提高效率。