69视频免费看免费看不卡_男生的坤坤放在女生的坤里视频_婷婷色激情综合_国产99爱视频在线观看_国产日韩欧美高清亚洲_无码AV中文一二三区_国产精品sm重味_一级黄色免费网站_中文字幕精品第一页_伊人久久大香线蕉综合不卡

登錄甲子光年
其他登錄方式
登錄即表示你已閱讀并同意
《甲子光年用戶(hù)注冊(cè)協(xié)議隱私政策
找回密碼
獲取驗(yàn)證碼
注冊(cè)甲子光年
獲取驗(yàn)證碼
注冊(cè)即表示你已閱讀并同意
《甲子光年用戶(hù)注冊(cè)協(xié)議隱私政策
綁定手機(jī)號(hào)
獲取驗(yàn)證碼
登錄即表示你已閱讀并同意
《甲子光年用戶(hù)注冊(cè)協(xié)議隱私政策
完善資料
登錄即表示你已閱讀并同意
《甲子光年用戶(hù)注冊(cè)協(xié)議隱私政策
微信登錄
掃描二維碼 | 授權(quán)登錄甲子光年
被DeepSeek卷到了!Sam Altman首次承認(rèn)OpenAI的閉源策略“站在了歷史錯(cuò)誤的一邊”
作者:趙健 2025-02-01

北京時(shí)間2月1日凌晨,OpenAI正式發(fā)布o(jì)3-mini,這是OpenAI推理系列中最新、最具成本效益的模型,已在ChatGPT和API中開(kāi)放使用。


這可以看作OpenAI對(duì)過(guò)去一周多風(fēng)靡美國(guó)市場(chǎng)的DeepSeek的回應(yīng)。


在o3 mini發(fā)布的同時(shí),OpenAI高管團(tuán)隊(duì)還在Reddit上舉辦了一場(chǎng)線(xiàn)上的AMA(ask me anything),回答有關(guān)o3 mini以及AI發(fā)展相關(guān)的一切問(wèn)題。


在被問(wèn)及是否會(huì)考慮發(fā)布一些模型權(quán)重以及一些研究時(shí),OpenAI首席執(zhí)行官Sam Altman首次承認(rèn):“我個(gè)人認(rèn)為,我們?cè)谶@里站在了歷史的錯(cuò)誤一邊,需要找出一個(gè)不同的開(kāi)源策略。OpenAI中并非所有人都認(rèn)同這一觀點(diǎn),這也不是我們當(dāng)前的最高優(yōu)先事項(xiàng)?!?/span>


此外,OpenAI高管團(tuán)隊(duì)還討論了o3 mini的功能、價(jià)格以及其他產(chǎn)品更新、算力等相關(guān)的話(huà)題。


可以說(shuō),如果沒(méi)有DeepSeek,OpenAI不會(huì)這么快做出回應(yīng),無(wú)論是模型還是言論。




1.OpenAI首次將推理模型開(kāi)放給免費(fèi)用戶(hù)


本次發(fā)布的o3-mini在2024年12月發(fā)布了預(yù)覽版本,是OpenAI首個(gè)支持高度請(qǐng)求的開(kāi)發(fā)者功能的小型推理模型,包括函數(shù)調(diào)用、結(jié)構(gòu)化輸出和開(kāi)發(fā)者消息。o3-mini將支持流式傳輸,開(kāi)發(fā)者還可以在三種推理努力選項(xiàng)——低、中、高——之間進(jìn)行選擇,以?xún)?yōu)化其特定用例。這種靈活性使得o3-mini在解決復(fù)雜挑戰(zhàn)時(shí)可以“更努力地思考”,或者在延遲是關(guān)鍵問(wèn)題時(shí)優(yōu)先考慮速度。但是o3-mini不支持視覺(jué)能力,因此開(kāi)發(fā)者應(yīng)繼續(xù)使用OpenAI o1進(jìn)行視覺(jué)推理任務(wù)。


OpenAI表示o3-mini突破了小型模型所能實(shí)現(xiàn)的界限,提供了卓越的STEM(Science、Technology、Engineering、Mathematics)功能,尤其擅長(zhǎng)科學(xué)、數(shù)學(xué)和編碼,同時(shí)保持了o1-mini的低成本和低延遲。專(zhuān)家測(cè)試人員的評(píng)估表明,與OpenAI o1-mini相比,o3-mini的答案更準(zhǔn)確、更清晰,推理能力更強(qiáng)。


OpenAI表示,測(cè)試人員在56%的時(shí)間里更喜歡o3-mini的回答,并觀察到在困難的現(xiàn)實(shí)問(wèn)題上重大錯(cuò)誤減少了 39%。在中等推理努力下,o3-mini在一些最具挑戰(zhàn)性的推理和智力評(píng)估(包括 AIME 和 GPQA)上的表現(xiàn)與o1相當(dāng)。


價(jià)格層面,OpenAI提供了不同的套餐設(shè)置:Pro用戶(hù)將可以無(wú)限制訪(fǎng)問(wèn)o3-mini,而Plus和Team用戶(hù)將擁有三倍的速率限制(與o1-mini相比);免費(fèi)用戶(hù)可以通過(guò)選擇消息編寫(xiě)器下方的“Reason”按鈕在ChatGPT中嘗試o3-mini。


這是OpenAI首次將推理模型開(kāi)放給免費(fèi)用戶(hù),此前發(fā)布的o1模型只有ChatGPT plus會(huì)員可以使用。而免費(fèi)開(kāi)放的原因其實(shí)也很顯然,那就是被DeepSeek免費(fèi)且開(kāi)源的R1給卷到了。


不過(guò),ChatGPT plus會(huì)員會(huì)享有更高版本的模型“o3-mini-high”,它會(huì)思考得更深入,并給出更好的答案。


作為此次升級(jí)的一部分,OpenAI將Plus和Team用戶(hù)的速率限制從每天50條消息(使用o1-mini)提高到每天150條消息(使用o3-mini)。此外,o3-mini現(xiàn)在可以與搜索功能配合使用,以查找最新的答案并鏈接到相關(guān)的網(wǎng)絡(luò)資源。這是OpenAI將搜索功能整合到推理模型中的早期原型。


在安全層面,OpenAI用來(lái)教o3-mini安全響應(yīng)的關(guān)鍵技術(shù)之一是審慎對(duì)齊,即在回答用戶(hù)提示之前,訓(xùn)練模型推理人類(lèi)編寫(xiě)的安全規(guī)范。與OpenAI o1類(lèi)似,o3-mini在具有挑戰(zhàn)性的安全性和越獄評(píng)估方面明顯超越了GPT-4o。在部署之前,OpenAI表示仔細(xì)評(píng)估了o3-mini的安全風(fēng)險(xiǎn),采用了與o1相同的準(zhǔn)備、外部紅隊(duì)和安全評(píng)估方法。




2.OpenAI團(tuán)隊(duì)回答一切


OpenAI高管團(tuán)隊(duì)在Reddit上舉辦了一場(chǎng)線(xiàn)上的AMA(ask me anything),回答有關(guān)o3 mini以及AI發(fā)展相關(guān)的一切問(wèn)題。


參與本次活動(dòng)的共6人,包括首席執(zhí)行官Sam Altman、首席研究官M(fèi)ark Chen、首席產(chǎn)品官Kevin Weil、工程副總裁Srinivas Narayanan、API 研究主管Michelle Pokrass、研究主管Hongyu Ren。


首先是大家最關(guān)心的關(guān)于DeepSeek的焦點(diǎn)問(wèn)題。


有用戶(hù)表示顯然這是一個(gè)非常令人印象深刻的模型,這會(huì)如何改變OpenAI對(duì)未來(lái)模型的計(jì)劃?


Sam Altman此前對(duì)于DeepSeek評(píng)價(jià)很高,這次也給出了類(lèi)似的評(píng)價(jià)。他回復(fù)稱(chēng):“這是一個(gè)非常好的模型!我們將生產(chǎn)出更好的模型,但領(lǐng)先優(yōu)勢(shì)將比前幾年有所減弱?!?/span>


鑒于DeepSeek在開(kāi)源領(lǐng)域取得的成功,有人問(wèn)OpenAI是否考慮發(fā)布一些模型權(quán)重并發(fā)表一些研究?


Sam Altman對(duì)此回應(yīng)稱(chēng):“是的,我們正在討論。我個(gè)人認(rèn)為,我們?cè)谶@里站在了歷史的錯(cuò)誤一邊,需要找出一個(gè)不同的開(kāi)源策略;OpenAI中并非所有人都認(rèn)同這一觀點(diǎn),這也不是我們當(dāng)前的最高優(yōu)先事項(xiàng)。”


這似乎是Sam Altman首次正面承認(rèn)OpenAI的閉源“是一個(gè)錯(cuò)誤”。但OpenAI是否會(huì)真正開(kāi)源?這恐怕將是一個(gè)艱難的選擇。


第二個(gè)集中話(huà)題是關(guān)于o3 mini的產(chǎn)品功能。


首先是價(jià)格問(wèn)題。有人對(duì)比發(fā)現(xiàn),o3 mini的價(jià)格與Deepseek和Gemini相比仍然沒(méi)有競(jìng)爭(zhēng)力。比如,在百萬(wàn)tokens規(guī)模下,Deepseek R1的API輸入價(jià)格(緩存命中)為0.14美元,輸出價(jià)格為2.19美元,而o3 mini的輸入價(jià)格為0.55美元,輸出價(jià)格為4.40美元。


OpenAI API研究主管Michelle Pokrass對(duì)此回應(yīng):“我們發(fā)現(xiàn)o3-mini與美國(guó)托管的Deepseek版本相比具有競(jìng)爭(zhēng)力。我們認(rèn)為對(duì)于這種級(jí)別的智能來(lái)說(shuō),這是一個(gè)真正實(shí)惠的選擇?!?/span>


OpenAI會(huì)計(jì)劃提高plus會(huì)員的價(jià)格嗎?Sam Altman回應(yīng)稱(chēng):“實(shí)際上我想隨著時(shí)間的推移減少它。”


大模型推理成本的下降是一個(gè)必然趨勢(shì)。OpenAI在發(fā)布o(jì)3 mini時(shí)表示,該模型延續(xù)了其降低智能成本的記錄——自推出GPT-4以來(lái),每個(gè)token的價(jià)格降低了95%——同時(shí)保持了頂級(jí)的推理能力。


針對(duì)o3 mini的價(jià)格,OpenAI制定了不同的套餐模式。有人問(wèn),為什么當(dāng)plus用戶(hù)擁有大量o3-mini-high限額時(shí),訂閱PRO版本仍然值得?


Sam Altman回應(yīng)稱(chēng),如果你認(rèn)為o1 pro還算值得,那么你應(yīng)該認(rèn)為o3 pro超級(jí)值得。


工程副總裁Srinivas Narayanan進(jìn)一步解釋?zhuān)骸拔覀儸F(xiàn)在有o1專(zhuān)業(yè)模式,還有操作員模式。我們可能會(huì)繼續(xù)有更多方法使用更多計(jì)算來(lái)解決專(zhuān)業(yè)級(jí)的難題。是的,專(zhuān)業(yè)用戶(hù)喜歡無(wú)速率限制?!?/span>


其次是思維鏈的展示問(wèn)題。o3 mini并不像DeepSeek R1那樣給出非常詳細(xì)的思維鏈過(guò)程,而是非常簡(jiǎn)潔。

于是有用戶(hù)提問(wèn),我們能看看所有的思考標(biāo)記嗎?


首席產(chǎn)品官Kevin Weil回復(fù)稱(chēng):“我們正在努力展示比今天更多的內(nèi)容——很快就會(huì)實(shí)現(xiàn)。所有內(nèi)容都有待確定,展示所有CoT會(huì)導(dǎo)致競(jìng)爭(zhēng)性提煉,但我們也知道人們(至少是高級(jí)用戶(hù))想要它,所以我們會(huì)找到正確的方法來(lái)平衡它?!?/span>


關(guān)于o3 mini知識(shí)庫(kù)的時(shí)間更新問(wèn)題,有用戶(hù)表示不理解?!霸谖抑Ц读藀lus費(fèi)用之前,GPT-4o擁有的知識(shí)截止到2024年6月,但是現(xiàn)在我支付了plus費(fèi)用,知識(shí)截止時(shí)間又改回了2023年10月。為什么會(huì)這樣?”


Sam Altman對(duì)此回應(yīng)稱(chēng):“現(xiàn)在我們已經(jīng)啟用了搜索功能,這一點(diǎn)就不再那么重要了——就我自己的使用而言,我再也沒(méi)有考慮過(guò)知識(shí)截止的問(wèn)題了?!?/span>


OpenAI本次發(fā)布的是o3 mini,于是有人問(wèn)完整版本o3何時(shí)首次亮相?


Sam Altman一如既往開(kāi)始畫(huà)餅:“我猜會(huì)是幾周以上,幾個(gè)月以下。”


第三個(gè)話(huà)題集中在其他產(chǎn)品更新,也就是OpenAI曾經(jīng)發(fā)布的“期貨”產(chǎn)品何時(shí)兌現(xiàn)。


有用戶(hù)關(guān)心4o圖像生成器是否還會(huì)發(fā)布,這是大約一年前OpenAI發(fā)布的功能。GPT-4o是一種多模態(tài)人工智能模型,可同時(shí)理解和生成文本、圖像和音頻內(nèi)容,但目前為止圖像生成功能還未更新。


首席產(chǎn)品官Kevin Weil對(duì)此回復(fù)稱(chēng):“是的!我們正在努力。我認(rèn)為等待是值得的?!庇腥死^續(xù)追問(wèn)有沒(méi)有大概的時(shí)間表,Kevin Weil先是開(kāi)玩笑地說(shuō)“你想給我找麻煩”,隨后又補(bǔ)充說(shuō)“可能要幾個(gè)月”。


此外,關(guān)于圖像生成模型DALL-3的后續(xù)版本,Kevin Weil也是一模一樣的回復(fù):“是的!我們正在努力。我認(rèn)為等待是值得的?!?/span>


有用戶(hù)對(duì)此“千篇一律”的回復(fù)表示不滿(mǎn)意,并調(diào)侃道“這是GPT-3在回應(yīng)嗎?”


有用戶(hù)關(guān)注長(zhǎng)上下文窗口的問(wèn)題,詢(xún)問(wèn)能否很快實(shí)現(xiàn)1M上下文。


對(duì)此,工程副總裁Srinivas Narayanan回復(fù)“正在努力,但沒(méi)有明確的日期表”。


關(guān)于很多人都關(guān)心的GPT-5,Sam Altman表示還沒(méi)有時(shí)間表。


首席產(chǎn)品官Kevin Weil則回應(yīng)稱(chēng),會(huì)在“o-17 micro和 GPT-(π+1) 之后不久”。換句話(huà)說(shuō),遙遙無(wú)期。


不過(guò)Sam Altman表示會(huì)有一些即將發(fā)布的更新,比如高級(jí)語(yǔ)音模式。


有人問(wèn),有了語(yǔ)音、視頻、屏幕共享、任務(wù)和操作員,OpenAI現(xiàn)在已經(jīng)發(fā)布了相當(dāng)多的組件,這些組件共同構(gòu)成了非常完整的自動(dòng)化體驗(yàn)。在我們可以說(shuō)擁有完整的AI體驗(yàn)之前,是否還缺少一些部分?如果是,那么缺少哪些部分?


對(duì)此,工程副總裁Srinivas Narayanan回復(fù):“是的,很多部分正在整合在一起。繼續(xù)提高推理能力仍然是最關(guān)鍵的部分。連續(xù)的視頻輸入和視頻輸出真的很酷。在任何環(huán)境中實(shí)現(xiàn)自動(dòng)化——不僅僅是瀏覽器,而是整個(gè)計(jì)算機(jī)或其他設(shè)備。以及輕松理解和使用不同應(yīng)用程序(在工作和個(gè)人生活中)的能力?!?/span>


最后是關(guān)于算力以及AGI相關(guān)的問(wèn)題。


有人問(wèn),假設(shè)現(xiàn)在是2030年,你剛剛創(chuàng)建了一個(gè)大多數(shù)人稱(chēng)之為AGI的系統(tǒng)。它在你提出的每一個(gè)基準(zhǔn)測(cè)試中都表現(xiàn)出色,并且在速度和性能上都擊敗了你最好的工程師和研究人員?,F(xiàn)在怎么辦?除了“在網(wǎng)站上提供”之外,還有其他計(jì)劃嗎?


工程副總裁Srinivas Narayanan回復(fù):“我們與人工智能交互的界面將發(fā)生根本性的變化。事情將變得更加代理化。人工智能將在后臺(tái)為我們持續(xù)工作,完成復(fù)雜的任務(wù)并實(shí)現(xiàn)我們的目標(biāo)。它們會(huì)在有需要時(shí)向我們匯報(bào)。機(jī)器人技術(shù)也應(yīng)該足夠先進(jìn),讓它們能夠在現(xiàn)實(shí)世界中為我們完成有用的任務(wù)?!?/span>


Sam Altman認(rèn)為,最重要的影響是加速科學(xué)發(fā)現(xiàn)的速度,我相信這是對(duì)改善生活質(zhì)量的最大貢獻(xiàn)。


有人提到了芯片,問(wèn)OpenAI如何看待trillium、cerebers等更專(zhuān)用的芯片/TPU?OpenAI正在研究這些芯片嗎?


Sam Altman的回應(yīng)很簡(jiǎn)潔:GB200現(xiàn)在很難被擊敗!


不久之前,Sam Altman宣布第一個(gè)完整的8機(jī)架GB200 NVL72現(xiàn)已在Azure中為OpenAI運(yùn)行。


有人問(wèn),Stargate(星際之門(mén))的成功對(duì) OpenAI 的未來(lái)有多重要?


首席產(chǎn)品官Kevin Weil回應(yīng)稱(chēng):“非常重要。我們看到的一切都表明,我們擁有的計(jì)算能力越多,我們構(gòu)建的模型就越好,我們制造的產(chǎn)品就越有價(jià)值。我們現(xiàn)在同時(shí)在兩個(gè)維度上擴(kuò)展模型——更大的預(yù)訓(xùn)練和更多的 RL/strawberry——兩者都需要計(jì)算。為數(shù)億用戶(hù)提供產(chǎn)品也是如此!隨著轉(zhuǎn)向?yàn)槟掷m(xù)工作的更多代理產(chǎn)品,這需要計(jì)算。所以把 Stargate 想象成我們的工廠(chǎng),它將電力/GPU 轉(zhuǎn)化為適合您的超棒產(chǎn)品。”


看起來(lái),DeepSeek與OpenAI已經(jīng)形成了兩種不同的技術(shù)路線(xiàn)。


DeepSeek代表了以更低的成本,尤其是計(jì)算成本,來(lái)實(shí)現(xiàn)更高的性能的路線(xiàn)。而OpenAI是Scaling Law的忠實(shí)信仰者,仍然堅(jiān)持“大力出奇跡”——如果繼續(xù)擴(kuò)展計(jì)算,就能繼續(xù)擴(kuò)展性能。


這兩種不同路線(xiàn)的選擇就是實(shí)現(xiàn)AGI的分水嶺嗎?


  • 102417
  • 39276
  • 1999
  • 0
評(píng)論