OpenAI再推开源模型 被讽“无效更新”******
图:Meta创办人朱克伯格(左)和妻子普莉希拉.陈。\路透社
当地时间8月5日,OpenAI宣布推出两款全新开源模型。这是自2019年发布GPT-2以来,OpenAI再次释出开源模型。外界认为,近年来中国AI公司如DeepSeek、阿里巴巴等在开放AI领域发展迅猛,Meta近期又以重金挖走多位OpenAI研究人员,再加上新一代模型GPT-5迟迟未能面世,面对各方种种压力,OpenAI不得不被迫转型。公司CEO阿尔特曼早前坦言,在是否开源的问题上,OpenAI站在了“历史错误的一边”。
【大公报讯】OpenAI于8月5日推出两款开源模型,GPT-oss-120b和GPT-oss-20b,可在开源技术平台Hugging Face上免费下载。这也是OpenAI自2019年发布GPT-2以来,时隔6年再次释出开源模型。
不过,由于新模型在性能上未有质的飞跃,此次释出的两个开源模型也被网友戏称是“挤牙膏式无效更新”。
“AI幻觉”多 未公开训练数据
根据科技媒体TechCrunch披露的技术数据,在多项测试中,GPT-oss-120b和GPT-oss-20b的表现均逊于OpenAI的o3和o4-mini模型。
此外,这两款新模型回答问题时出现“AI幻觉”的比例分别高达49%和53%,是o1模型(16%)的三倍多,也高于o4-mini模型(36%)。
虽然OpenAI并未透露用于训练新模型的数据,因此还未能达到完全“开源”的标准,但其自2022年发布聊天机器人ChatGPT并引发AI热潮以来,便对自家技术严格保密,此次发布开源模型可以说是一次巨大转变。
当被问及“为什么突然又开源”时,OpenAI称是为了“加速前沿研究,促进创新,并推动在广泛应用场景下实现更安全、更透明的AI开发”。
但外界认为,种种压力之下,OpenAI不得不作出改变。
中国开源模型的爆发式发展很难不触动OpenAI以及硅谷的神经。今年年初,中国AI初创公司深度求索(DeepSeek)释出震撼硅谷的开源模型R1,此后大批中国模型走上开源之路。
以阿里巴巴集团开发的AI模型Qwen为例,Qwen2.5去年在Hugging Face上的下载量甚至超过美科企巨头Meta旗下的Llama系列,成为全球下载量最多的开源模型。
在美国国内,自6月以来,Meta创办人朱克伯格对OpenAI展开大规模挖角,迄今已聘用其中至少10人,加入自家AI研发团队“超级智能实验室”。
中国开源AI领跑 美业界难追
除外部压力,OpenAI自身也面临困境,其最新模型GPT-5已“难产”数月。为缓解外界焦虑,OpenAI只得一次次释出新产品。
分析指出,全球科企在AI方面的竞争已趋白热化,美国公司在开源模型方面已落后于中国同业。
全球知名AI基准测试机构Artificial Analysis发现,在排名前15的AI模型中,仅有5个为开源,且全部来自中国的AI公司。
随着开源AI浪潮席卷全球,业界预估,到2030年,先进AI模型的平均开发成本预计下降40%,令更多小企业能够负担得起。
8月4日,美国业界正式启动了一项名为“美国真正开源模型”(ATOM)的新计划,拟集中资源开发强大的AI开源模型。但有评论指出,这项计划虽然雄心勃勃,但仍存在人才缺失、协调不足和成本高昂等问题。
(综合报道)
未雨绸缪/提高应对能力 加快韧性城市建设******
近日,京津冀、粤港澳等城市群几乎同时遭大暴雨袭击,加上此前的北京7.30大暴雨、郑州7.20大暴雨等重大灾害事件,内涝、水浸、洪水、山洪等问题正暴露出城市的脆弱性。华中科技大学国家治理研究院副院长、经济学院教授孙永平曾表示,“由于气候不确定性的风险日益增加,对于城市气候安全千万不要抱有侥幸心理。推进韧性城市建设,需要系统谋划,久久为功。”在极端天气尤其暴雨灾害频发的气候变化背景下,城市应当如何加强气候韧性,成为亟待思考的问题。
旧城改造和城市更新是难点
值得注意的是,常年面对台风、强对流天气等引发的暴风雨天气,大湾区城市基本都形成了一定的从风险预警到应急处置相对完整的应对流程,然而城市内涝还是会发生。多位专家分析,表面看这是排水问题,实际上更是城市规划的问题。暨南大学公共管理学院、应急管理学院副院长李伟权分析,内地许多大城市都存在早期韧性城市规划缺失的问题。因此,旧城改造和城市更新提高城市的韧性能力是现代城市建设难点。需要通过打造智慧应急系统、改造基础设施、改革应急管理体系等方面建设,综合性弥补先天不足。
除此之外,还有高温之下的劳动保护、人文关怀等也拷问着社会保障机制。更进一步,当雨水、温度等气候资源发生变化,农、工产业结构等社会经济系统是否需要调整,都将成为气候变化下,对城市提出的新挑战。\大公报记者李紫妍