手机av在线播放,国产成人精品高清在线,欧美在线看片a免费观看

GPT-5猛了，但普通人不感興趣了

吳曉波頻道

2025-08-09 10:53:22

“頭部應用 DeepSeek 月均下載量較第一季度環(huán)比下跌 72.2% ；騰訊元寶月均下載量環(huán)比下跌 54% ； Kimi 月均下載量環(huán)比跌 57.7% ?！?/span>

文 / 巴九靈（微信公眾號：吳曉波頻道）

900天，GPT-5終于閃亮登場，但是朋友圈似乎并沒有那么熱鬧。

圈內(nèi)人士轉(zhuǎn)發(fā)點贊，說要“搶走打工人飯碗了”，而圈外人士了無波瀾。

圖源：OpenAI官網(wǎng)

在發(fā)布會前后，OpenAI CEO山姆·奧特曼做足了給世界一個“驚喜”的氛圍。

會場前說，面對GPT-5，感覺自己一無是處；會場中，把GPT-5形容為熟悉各個領域的專家；在會后的宣發(fā)文章，則是強調(diào)它“博士級”的智能水平。

奧特曼甚至不惜否定前作：“GPT-3像個高中生，GPT-4像個大學生?！薄拔覈L試過用回GPT-4，但效果相當糟糕。”

他在發(fā)布會上反復強調(diào)這些話。

OpenAI發(fā)布會，山姆·奧特曼

怎么形容GPT-5呢？結(jié)合報道和專家分析，總結(jié)如下

◎ 首先，編程能力變強了。

比如，可以兩分鐘就可以搭建出一個完整網(wǎng)站，五分鐘做出一款語言學習App，并能精準識別并修復Bug。

當然，還是不免出現(xiàn)Bug。比如，演示過程中展示的性能測試圖表制造了GPT-5“碾壓式領先”GPT-o3和GPT-4o模型的“幻象”。

◎ 其次，實現(xiàn)免費了。

GPT-5首次使用推理模型來支持ChatGPT的免費版本。用奧特曼的話來說：“讓每個人都能獲得博士級別的智慧?！?/p>

知名數(shù)字經(jīng)濟學者劉興亮高速小巴，“這反映了AI應用正逐漸邁向‘免費也能用上高級能力’的趨勢，標志著更復雜、更可靠的AI技術正在普惠大眾，不再局限于付費人群?！?/p>

但是，“不是真免費，有限制，用多了或者問題太復雜，它就會切換成“迷你版”（GPT-5 mini），這個版本能力就弱一些了。想一直用好的，還是得掏錢買Plus或者更貴的Pro?！鄙疃瓤萍佳芯吭涸洪L張孝榮如此補充道。

◎ 第三，下了大力氣解決“AI幻覺”。

GPT-5聯(lián)網(wǎng)搜索時錯誤率比GPT-4o低45%，獨立思考時錯誤率比OpenAI o3低80%。

OpenAI發(fā)布會

然而，就在GPT5發(fā)布前的幾個月，人們對AI應用的熱情出現(xiàn)明顯消退。

點點數(shù)據(jù)顯示，2025年5月，全球AI APP蘋果App Store與谷歌GooglePlay雙端預估下載總量達2.8億次（不含重復下載），環(huán)比4月下滑了16.4%。

6月，下載總量達2.7億次，環(huán)比下滑了1.6%；7月，3.4億次，環(huán)比6月上漲了24.9%。

此外，TOP 5應用下載量占比中，ChatGPT、Google Gemini分別由6月份的35%和8%下滑至7月份的29%和5%。

在國內(nèi)，據(jù)《2025年二季度AI應用價值榜》顯示，頭部應用DeepSeek月均下載量較第一季度環(huán)比下跌72.2%，其MAU環(huán)比下滑9.3%；騰訊元寶月均下載量環(huán)比下跌54%；Kimi月均下載量環(huán)比跌57.7%，同時MAU環(huán)比降35%。

姍姍來遲的GPT-5到底帶來了哪些突破性的改變，為什么普通人對包括它在內(nèi)的AI應用不再“熱誠”，要如何喚起大家對AI的興趣？小巴邀請了業(yè)內(nèi)人士來深入談談。

GPT-5的核心優(yōu)勢是什么？哪些方面不如預期？

陸新之

商界AI新媒體總編輯

央媒評論員

可能是因為事先張揚很久，千呼萬喚始出來之后，倒沒有感覺到特別驚艷。

但是用起來還是能有變化，回答更嚴謹，準確度變高，也更簡潔了。

實事求是來說，今時今日的大模型的版本進化，不會有太革命性的飛躍了。

之前4o的多模態(tài)發(fā)布那次的驚艷感，已經(jīng)很難重現(xiàn)。暫時可見，對比國內(nèi)的DeepSeek、豆包和通義等同類，GPT-5還是綜合能力更強一些，而且自動動態(tài)切換思考和非思考模型。

初步感覺的這版核心優(yōu)勢，就是代碼能力和推理能力的進化，這個大部分普通人感知不明顯，開發(fā)者可能感知明顯一些。

當然，不及我們期待的，就是Agent能力，因為這應該是OpenAI的方向之一，本來期待的是一出來就可以替代大部分通用Agents，顯然現(xiàn)在還做不到，得等下一版了。

張孝榮

深度科技研究院院長

GPT-5確實進步不小，好用多了，但沒能成神。

尤其是所謂“博士級智能水平”還是有點夸大。

我認為，它在編程領域進步最突出，比如讓它寫個帶學習功能的法語小游戲網(wǎng)頁，幾分鐘就能整出來，代碼寫得還挺好看，比之前處于大學生水平的GPT-4強一截。數(shù)學推理能力的得分也不錯，準確率提升，幻覺率下降。

看病歷報告啥的，也能解釋得比較清楚，還帶點人情味兒（當然，醫(yī)生還是得看，不能全靠它）。

文章寫作上，比上一代更接近人類風格，當然，跟人類作家相比，還是有點生硬。

中文能力還是差點意思。用中文寫東西，比如寫短視頻腳本、文章啥的，它出來的東西還是有點“外國味兒”，語感不如國內(nèi)的通義千問，DS，文小言等。

看圖看視頻的能力，也比不過之前的GPT-4o和國內(nèi)的通義，比如讓它分析個復雜圖表或者中國公司財報，就很容易抓瞎。

AI幻覺下降是值得稱道的一大進步。比如讓它上網(wǎng)查資料再回答，它犯錯幾率比GPT-4o低了45%；讓它認真思考復雜問題，犯錯幾率比之前的“聰明版”低了80%。實在搞不懂或者問題不對，它也會老實承認“我不會”或者“你這問題有問題”，不會硬著頭皮瞎蒙。

美國用戶使用OpenAI GPT-5人工智能模型

劉興亮

知名數(shù)字經(jīng)濟學者

工信部信息通信經(jīng)濟專家委員會委員

1.形態(tài)進化。從“選模型”到“模型會選自己”，GPT-5直接成了ChatGPT的默認款，會根據(jù)任務自動決定“快答”還是“深想”，你也能手動切換到“GPT-5 Thinking/Pro”來走更長推理，而且這次面向所有用戶開放，付費用戶只是額度更高，同時還上了語音升級、學習模式，以及接入了Gmail/日歷等“生活插件”。

一句話，少折騰菜單，多交付結(jié)果。

2.硬指標+新工具。碼得更像人，寫得更像你。官方放出的基準顯示，GPT-5在數(shù)字、真實世界編碼、視覺和健康等多項評測拔尖，并且強化多步指令與工具編排……翻譯成人話就是：寫代碼更少廢話，走流程更少走神。

3.更聰明不等于更“上道”，更安全不等于沒風險。

我很認可它在推理/編碼的進步，但在寫作質(zhì)感和AGI跨度上并沒有達到我的想象。OpenAI一邊高舉“更少幻覺/更少欺騙”的大旗，一邊推出“Safe-Completions”安全訓練并承認涉及生物等領域的高風險屬性，這意思就是說能干的更多了，能“作妖”的邊界也得更嚴。

在商業(yè)層面上，GPT-5更像一臺利潤引擎，鋪開給全體用戶，押注企業(yè)用量會放大。所以，我給GDP-5的初步結(jié)論是四個更——更快更強更準更懂我。

但我更想強調(diào)的是，別急著給程序員寫墓志銘，也別指望它給PPT裝靈魂，先把它當超級實習生，該放權放權，該驗收驗收。

怎么看國內(nèi)外頭部AI應用的下載和月活出現(xiàn)明顯下滑？

陸新之

商界AI新媒體總編輯

央媒評論員

大模型廠家與巨頭很興奮，但是一直沒有剛需應用，還缺一個現(xiàn)象級出圈的產(chǎn)品，所以在殺手級應用出來之前，大多數(shù)開發(fā)者與中小公司還得煎熬一段。AI時代也在呼喚移動互聯(lián)網(wǎng)時代的TikTok與拼多多。

現(xiàn)在的AI應用發(fā)力方向，逐步轉(zhuǎn)向業(yè)務+AI，而不是純AI應用，這是比較務實的。但是也缺少一點想象力。目前，除了頂級的大模型，大部分AI應用都是基于原有的業(yè)務或者行業(yè)經(jīng)驗+AI去做原有業(yè)務的增長和進化。當然，原生AI應用新造的需求很難出圈，目前也難有清晰的商業(yè)模式。但是真正未來能夠指數(shù)級發(fā)展的公司，更大可能還是在原生AI應用。

張孝榮

深度科技研究院院長

當前下滑是行業(yè)擠泡沫的陣痛，用戶過了嘗鮮期，只保留有用的工具，這也是市場走向成熟的必經(jīng)之路——能活下來的，必是那些讓AI從“炫技”變成“水電煤”的產(chǎn)品。那些蹭熱點、同質(zhì)化、做流量、創(chuàng)新不足的產(chǎn)品，注定會被淘汰。

現(xiàn)在AI圈打得很熱鬧，基本是“巨頭打架，小廠找縫鉆”的局面，現(xiàn)在拼的是誰能綁定用戶生活、誰更便宜、誰解決實際問題。單打獨斗的小AI，基本沒戲了。

從國內(nèi)外對比來看，國外AI在算力上領先優(yōu)勢明顯，技術迭代速度加快。

劉興亮

知名數(shù)字經(jīng)濟學者

工信部信息通信經(jīng)濟專家委員會委員

普適型聊天機器人疲軟，用戶興趣轉(zhuǎn)移。通用AI聊天應用下載量大幅下降，MAU也下滑明顯，這說明這一類產(chǎn)品已經(jīng)失去新鮮感，用戶轉(zhuǎn)而青睞更具針對性的工具型應用（如辦公、教育類AI工具）。

產(chǎn)品定位與差異化不足。很多AI社交或聊天產(chǎn)品同質(zhì)化嚴重，功能體驗重復、引導缺乏新意，導致用戶留存率下降、興趣減弱。

行業(yè)轉(zhuǎn)向“功能垂類”應用。諸如AI寫作、在線輔導、助考類工具，在特定場景需求推動下表現(xiàn)仍強勁（如畢業(yè)季寫作需求上漲、AI高考志愿專家應用暴漲）。

AI應用市場已從“聊天爆款”回歸理性階段，用戶更愿意為“解決實際問題”的垂直應用埋單。

AI是否已經(jīng)開始改變了人們的生活？

張孝榮

深度科技研究院院長

在重復勞動、數(shù)據(jù)活上超有用，但搞藝術、做復雜決策、惠及普通人還差點意思，現(xiàn)在還是花拳繡腿，最多只發(fā)揮了六成功力。

大模型本質(zhì)是“語言縫合怪”，全靠拼詞造句碰答案，不懂分辨事實真假，加強倫理限制后，幻覺率更高。從根本上說，AI幻覺像“改不掉的撒謊習慣”，能管住七八成就不錯了，現(xiàn)在有許多技術可以減少AI幻覺，但是沒法根除。

陸新之

商界AI新媒體總編輯

央媒評論員

目前，AI應用的價值還遠遠沒有發(fā)揮出來，無論是對于工作與生活。更多的用戶還是當一個問答機器人，加點畫畫生成視頻等等，還是很淺的嘗試。

比如教育，對于懂AI的人來說會用提示詞就能把豆包變成一個很好用的教育工具，但是對于普通人就不知道怎么問，所以現(xiàn)階段的Agents有真實的需求，也能夠發(fā)展得快。對智能體來說，2025年下半年是一個窗口期。

幻覺問題我反而不是很擔心，因為還是能有解決的方法。大模型都有一個范圍調(diào)節(jié)，創(chuàng)意優(yōu)先的選擇但是自然幻覺率最高，而控制幻覺率的話，容易回答不全面，這也取決于個體的使用習慣。

其實大模型的預訓練的數(shù)據(jù)相對來說還是比較可控的，主要是聯(lián)網(wǎng)搜索之后的內(nèi)容常常出問題，這個需要巨頭后面改善搜索的RAG技術。同時，個人也要對于幻覺有警惕與覺察，要有自己的判斷來使用。

上一篇：實測GPT-5：寫作墜入谷底，編程一騎絕塵

下一篇：華人成GPT-5帶隊人，畢業(yè)兩年就成千萬富翁

香蕉在线视频网站,国产视频综合,亚洲综合五月天欧美,成人亚洲综合,日本欧美高清全视频,国产视频黄色,欧美高清在线播放