電話：7684-4867-7684

您當(dāng)前的位置: 星空綜合官網(wǎng) > OpenAI推出安全評估中心，定期公布AI模型評估結(jié)果以增強透明度

OpenAI推出安全評估中心，定期公布AI模型評估結(jié)果以增強透明度

作者：admin 發(fā)布時間：2025-06-01 13:24

IT之家 5 月 15 日消息，OpenAI 宣布將更頻繁地公開其內(nèi)部人工智能模型的安全評估結(jié)果，以提高透明度。該公司于周三正式上線了“安全評估中心”網(wǎng)頁，旨在展示其模型在有害內(nèi)容生成、模型越獄以及幻覺現(xiàn)象等方面的測試表現(xiàn)。

OpenAI 表示，該安全評估中心將用于持續(xù)發(fā)布模型相關(guān)指標(biāo)，并計劃在未來的重大模型更新后及時更新網(wǎng)頁內(nèi)容。OpenAI 在一篇博客文章中寫道：“隨著人工智能評估科學(xué)的不斷發(fā)展，我們致力于分享我們在開發(fā)更具可擴展性的模型能力與安全評估方法方面的進展。”該公司還強調(diào)，通過在此公開部分安全評估結(jié)果，不僅希望讓用戶更清晰地了解 OpenAI 系統(tǒng)隨時間的安全性能變化，也期望能夠支持整個行業(yè)在透明度方面的共同努力。此外，OpenAI 提到可能會隨著時間推移在該中心增加更多評估項目。

此前，OpenAI 曾因部分旗艦?zāi)Ｐ偷陌踩珳y試流程過快以及未發(fā)布其他模型的技術(shù)報告而受到一些倫理學(xué)家的批評。公司首席執(zhí)行官山姆?奧爾特曼（Sam Altman）也因被指在 2023 年 11 月短暫被免職前誤導(dǎo)公司高管關(guān)于模型安全審查的問題而備受爭議。

IT之家注意到，就在上個月末，OpenAI 不得不撤銷對 ChatGPT 默認模型 GPT-4o 的一次更新。原因是用戶報告稱該模型的回應(yīng)方式過于“諂媚”，甚至對一些有問題的、危險的決策和想法也表示贊同。針對這一事件，OpenAI 表示將采取一系列修復(fù)和改進措施，以防止類似事件再次發(fā)生。其中包括為部分模型引入一個可選的“alpha 階段”，允許部分 ChatGPT 用戶在模型正式發(fā)布前進行測試并提供反饋。

上一篇：蘋果澄清未阻止Epic在歐盟更新《堡壘之夜》手游

下一篇：斯基拉：齊沃可能與帕爾馬商討續(xù)約，助球隊成功保級

關(guān)于我們

產(chǎn)品中心

產(chǎn)品一類
產(chǎn)品二類
產(chǎn)品三類
產(chǎn)品四類

新聞中心

公司新聞
行業(yè)動態(tài)
專題報道

地址：湖北省武漢縣靜安澳門街4262號
電話：7684-4867-7684
郵箱：15034357@sohu.com

TOP

国产精品成人麻豆专区,无码日韩一区二区三区视频,麻豆亚洲欧美精品伊人久久,日韩中文字幕无线码