香蕉在线视频网站,国产视频综合,亚洲综合五月天欧美,成人亚洲综合,日本欧美高清全视频,国产视频黄色,欧美高清在线播放

GPT-5猛了,但普通人不感興趣了

“頭部 應用 DeepSeek 月均下載量 較第一季度環(huán)比 下跌 72.2% ; 騰訊元寶月均下載量 環(huán)比 下跌 54% ; Kimi 月均下載量 環(huán)比 跌 57.7% ?!?/span>

文 / 巴九靈(微信公眾號:吳曉波頻道)

900天,GPT-5終于閃亮登場,但是朋友圈似乎并沒有那么熱鬧。

圈內(nèi)人士轉(zhuǎn)發(fā)點贊,說要“搶走打工人飯碗了”,而圈外人士了無波瀾。

圖源:OpenAI官網(wǎng)

在發(fā)布會前后,OpenAI CEO山姆·奧特曼做足了給世界一個“驚喜”的氛圍。

會場前說,面對GPT-5,感覺自己一無是處;會場中,把GPT-5形容為熟悉各個領域的專家;在會后的宣發(fā)文章,則是強調(diào)它“博士級”的智能水平。

奧特曼甚至不惜否定前作:“GPT-3像個高中生,GPT-4像個大學生?!薄拔覈L試過用回GPT-4,但效果相當糟糕。”

他在發(fā)布會上反復強調(diào)這些話。

OpenAI發(fā)布會,山姆·奧特曼

怎么形容GPT-5呢?結(jié)合報道和專家分析,總結(jié)如下

◎ 首先,編程能力變強了。

比如,可以兩分鐘就可以搭建出一個完整網(wǎng)站,五分鐘做出一款語言學習App,并能精準識別并修復Bug。

當然,還是不免出現(xiàn)Bug。比如,演示過程中展示的性能測試圖表制造了GPT-5“碾壓式領先”GPT-o3和GPT-4o模型的“幻象”。

◎ 其次,實現(xiàn)免費了。

GPT-5首次使用推理模型來支持ChatGPT的免費版本。用奧特曼的話來說:“讓每個人都能獲得博士級別的智慧?!?/p>

知名數(shù)字經(jīng)濟學者劉興亮高速小巴,“這反映了AI應用正逐漸邁向‘免費也能用上高級能力’的趨勢,標志著更復雜、更可靠的AI技術正在普惠大眾,不再局限于付費人群?!?/p>

但是,“不是真免費,有限制,用多了或者問題太復雜,它就會切換成“迷你版”(GPT-5 mini),這個版本能力就弱一些了。想一直用好的,還是得掏錢買Plus或者更貴的Pro?!鄙疃瓤萍佳芯吭涸洪L張孝榮如此補充道。

◎ 第三,下了大力氣解決“AI幻覺”。

GPT-5聯(lián)網(wǎng)搜索時錯誤率比GPT-4o低45%,獨立思考時錯誤率比OpenAI o3低80%。

OpenAI發(fā)布 會

然而,就在GPT5發(fā)布前的幾個月,人們對AI應用的熱情出現(xiàn)明顯消退。

點點數(shù)據(jù)顯示,2025年5月,全球AI APP蘋果App Store與谷歌GooglePlay雙端預估下載總量達2.8億次(不含重復下載),環(huán)比4月下滑了16.4%。

6月,下載總量達2.7億次,環(huán)比下滑了1.6%;7月,3.4億次,環(huán)比6月上漲了24.9%。

此外,TOP 5應用下載量占比中,ChatGPT、Google Gemini分別由6月份的35%和8%下滑至7月份的29%和5%。

在國內(nèi),據(jù)《2025年二季度AI應用價值榜》顯示,頭部應用DeepSeek月均下載量較第一季度環(huán)比下跌72.2%,其MAU環(huán)比下滑9.3%;騰訊元寶月均下載量環(huán)比下跌54%;Kimi月均下載量環(huán)比跌57.7%,同時MAU環(huán)比降35%。

姍姍來遲的GPT-5到底帶來了哪些突破性的改變,為什么普通人對包括它在內(nèi)的AI應用不再“熱誠”,要如何喚起大家對AI的興趣?小巴邀請了業(yè)內(nèi)人士來深入談談。

1

GPT-5的核心優(yōu)勢是什么?哪些方面不如預期?

陸新之

商界AI新媒體總編輯

央媒評論員

可能是因為事先張揚很久,千呼萬喚始出來之后,倒沒有感覺到特別驚艷。

但是用起來還是能有變化,回答更嚴謹,準確度變高,也更簡潔了。

實事求是來說,今時今日的大模型的版本進化,不會有太革命性的飛躍了。

之前4o的多模態(tài)發(fā)布那次的驚艷感,已經(jīng)很難重現(xiàn)。暫時可見,對比國內(nèi)的DeepSeek、豆包和通義等同類,GPT-5還是綜合能力更強一些,而且自動動態(tài)切換思考和非思考模型。

初步感覺的這版核心優(yōu)勢,就是代碼能力和推理能力的進化,這個大部分普通人感知不明顯,開發(fā)者可能感知明顯一些。

當然,不及我們期待的,就是Agent能力,因為這應該是OpenAI的方向之一,本來期待的是一出來就可以替代大部分通用Agents,顯然現(xiàn)在還做不到,得等下一版了。

張孝榮

深度科技研究院院長

GPT-5確實進步不小,好用多了,但沒能成神。

尤其是所謂“博士級智能水平”還是有點夸大。

我認為,它在編程領域進步最突出,比如讓它寫個帶學習功能的法語小游戲網(wǎng)頁,幾分鐘就能整出來,代碼寫得還挺好看,比之前處于大學生水平的GPT-4強一截。數(shù)學推理能力的得分也不錯,準確率提升,幻覺率下降。

看病歷報告啥的,也能解釋得比較清楚,還帶點人情味兒(當然,醫(yī)生還是得看,不能全靠它)。

文章寫作上,比上一代更接近人類風格,當然,跟人類作家相比,還是有點生硬。

中文能力還是差點意思。用中文寫東西,比如寫短視頻腳本、文章啥的,它出來的東西還是有點“外國味兒”,語感不如國內(nèi)的通義千問,DS,文小言等。

看圖看視頻的能力,也比不過之前的GPT-4o和國內(nèi)的通義,比如讓它分析個復雜圖表或者中國公司財報,就很容易抓瞎。

AI幻覺下降是值得稱道的一大進步。比如讓它上網(wǎng)查資料再回答,它犯錯幾率比GPT-4o低了45%;讓它認真思考復雜問題,犯錯幾率比之前的“聰明版”低了80%。實在搞不懂或者問題不對,它也會老實承認“我不會”或者“你這問題有問題”,不會硬著頭皮瞎蒙。

美國用戶使用OpenAI GPT-5人工智能模型

劉興亮

知名數(shù)字經(jīng)濟學者

工信部信息通信經(jīng)濟專家委員會委員

1.形態(tài)進化。從“選模型”到“模型會選自己”,GPT-5直接成了ChatGPT的默認款,會根據(jù)任務自動決定“快答”還是“深想”,你也能手動切換到“GPT-5 Thinking/Pro”來走更長推理,而且這次面向所有用戶開放,付費用戶只是額度更高,同時還上了語音升級、學習模式,以及接入了Gmail/日歷等“生活插件”。

一句話,少折騰菜單,多交付結(jié)果。

2.硬指標+新工具。碼得更像人,寫得更像你。官方放出的基準顯示,GPT-5在數(shù)字、真實世界編碼、視覺和健康等多項評測拔尖,并且強化多步指令與工具編排……翻譯成人話就是:寫代碼更少廢話,走流程更少走神。

3.更聰明不等于更“上道”,更安全不等于沒風險。

我很認可它在推理/編碼的進步,但在寫作質(zhì)感和AGI跨度上并沒有達到我的想象。OpenAI一邊高舉“更少幻覺/更少欺騙”的大旗,一邊推出“Safe-Completions”安全訓練并承認涉及生物等領域的高風險屬性,這意思就是說能干的更多了,能“作妖”的邊界也得更嚴。

在商業(yè)層面上,GPT-5更像一臺利潤引擎,鋪開給全體用戶,押注企業(yè)用量會放大。所以,我給GDP-5的初步結(jié)論是四個更——更快更強更準更懂我。

但我更想強調(diào)的是,別急著給程序員寫墓志銘,也別指望它給PPT裝靈魂,先把它當超級實習生,該放權放權,該驗收驗收。

2

怎么看國內(nèi)外頭部AI應用的下載和月活出現(xiàn)明顯下滑?

陸新之

商界AI新媒體總編輯

央媒評論員

大模型廠家與巨頭很興奮,但是一直沒有剛需應用,還缺一個現(xiàn)象級出圈的產(chǎn)品,所以在殺手級應用出來之前,大多數(shù)開發(fā)者與中小公司還得煎熬一段。AI時代也在呼喚移動互聯(lián)網(wǎng)時代的TikTok與拼多多。

現(xiàn)在的AI應用發(fā)力方向,逐步轉(zhuǎn)向業(yè)務+AI,而不是純AI應用,這是比較務實的。但是也缺少一點想象力。目前,除了頂級的大模型,大部分AI應用都是基于原有的業(yè)務或者行業(yè)經(jīng)驗+AI去做原有業(yè)務的增長和進化。當然,原生AI應用新造的需求很難出圈,目前也難有清晰的商業(yè)模式。但是真正未來能夠指數(shù)級發(fā)展的公司,更大可能還是在原生AI應用。

張孝榮

深度科技研究院院長

當前下滑是行業(yè)擠泡沫的陣痛,用戶過了嘗鮮期,只保留有用的工具,這也是市場走向成熟的必經(jīng)之路——能活下來的,必是那些讓AI從“炫技”變成“水電煤”的產(chǎn)品。那些蹭熱點、同質(zhì)化、做流量、創(chuàng)新不足的產(chǎn)品,注定會被淘汰。

現(xiàn)在AI圈打得很熱鬧,基本是“巨頭打架,小廠找縫鉆”的局面,現(xiàn)在拼的是誰能綁定用戶生活、誰更便宜、誰解決實際問題。單打獨斗的小AI,基本沒戲了。

從國內(nèi)外對比來看,國外AI在算力上領先優(yōu)勢明顯,技術迭代速度加快。

劉興亮

知名數(shù)字經(jīng)濟學者

工信部信息通信經(jīng)濟專家委員會委員

普適型聊天機器人疲軟,用戶興趣轉(zhuǎn)移。通用AI聊天應用下載量大幅下降,MAU也下滑明顯,這說明這一類產(chǎn)品已經(jīng)失去新鮮感,用戶轉(zhuǎn)而青睞更具針對性的工具型應用(如辦公、教育類AI工具)。

產(chǎn)品定位與差異化不足。很多AI社交或聊天產(chǎn)品同質(zhì)化嚴重,功能體驗重復、引導缺乏新意,導致用戶留存率下降、興趣減弱。

行業(yè)轉(zhuǎn)向“功能垂類”應用。諸如AI寫作、在線輔導、助考類工具,在特定場景需求推動下表現(xiàn)仍強勁(如畢業(yè)季寫作需求上漲、AI高考志愿專家應用暴漲)。

AI應用市場已從“聊天爆款”回歸理性階段,用戶更愿意為“解決實際問題”的垂直應用埋單。

3

AI是否已經(jīng)開始改變了人們的生活?

張孝榮

深度科技研究院院長

在重復勞動、數(shù)據(jù)活上超有用,但搞藝術、做復雜決策、惠及普通人還差點意思,現(xiàn)在還是花拳繡腿,最多只發(fā)揮了六成功力。

大模型本質(zhì)是“語言縫合怪”,全靠拼詞造句碰答案,不懂分辨事實真假,加強倫理限制后,幻覺率更高。從根本上說,AI幻覺像“改不掉的撒謊習慣”,能管住七八成就不錯了,現(xiàn)在有許多技術可以減少AI幻覺,但是沒法根除。

陸新之

商界AI新媒體總編輯

央媒評論員

目前,AI應用的價值還遠遠沒有發(fā)揮出來,無論是對于工作與生活。更多的用戶還是當一個問答機器人,加點畫畫生成視頻等等,還是很淺的嘗試。

比如教育,對于懂AI的人來說會用提示詞就能把豆包變成一個很好用的教育工具,但是對于普通人就不知道怎么問,所以現(xiàn)階段的Agents有真實的需求,也能夠發(fā)展得快。對智能體來說,2025年下半年是一個窗口期。

幻覺問題我反而不是很擔心,因為還是能有解決的方法。大模型都有一個范圍調(diào)節(jié),創(chuàng)意優(yōu)先的選擇但是自然幻覺率最高,而控制幻覺率的話,容易回答不全面,這也取決于個體的使用習慣。

其實大模型的預訓練的數(shù)據(jù)相對來說還是比較可控的,主要是聯(lián)網(wǎng)搜索之后的內(nèi)容常常出問題,這個需要巨頭后面改善搜索的RAG技術。同時,個人也要對于幻覺有警惕與覺察,要有自己的判斷來使用。