标王 热搜： crm 设备管理系统分析设备电子仪器开关郑州成都饰品充值卡上海

总分第一！翻译第一！讯飞星火大模型传媒方向评测居首

更新时间：2024-07-04 13:43:52 浏览次数：5

7月3日，经北京大学、清华大学、浙江大学、中国传媒大学等高校教授的学术指导，北京智源研究院、中国经济传媒协会联合新京报共同发布的《大语言模型传媒方向能力测评调研报

7月3日，经北京大学、清华大学、浙江大学、中国传媒大学等高校教授的学术指导，北京智源研究院、中国经济传媒协会联合新京报共同发布的《大语言模型传媒方向能力测评调研报告》备受关注。测评报告涵盖了包括讯飞星火、文心一言、通义千问在内的9大国内主流大模型产品。

报告的评估体系涵盖了文本生成、事实核查与价值观判断、媒体信息检索、翻译能力以及长文本处理等五个关键能力维度，全面反映了媒体行业对AI技术的需求和期待。值得注意的是，如果将本次测评报告中所有五项维度的平均分进行横向比较，大模型的翻译能力得分6.42排名第一，可见传媒从业者对于大模型进行翻译工作的成效相较其他工作满意度更高。在这一单项评测中，讯飞星火得分6.84排名第一。

作为人工智能“国家队”成员，科大讯飞星火大模型在传媒方向能力评测中取得这一成绩并不意外，尤其在智能翻译方面，科大讯飞有着深厚的技术积累和持续的技术创新。在刚刚举行的国家科学技术奖励大会中，科大讯飞主导的《多语种智能语音技术及产业化》项目摘得国家科学技术进步奖一等奖，这是深度学习引发的新一代人工智能全球浪潮以来，人工智能项目首次荣获中国科技领域最高荣誉。

值得一提的是，本次贝壳财经峰会大模型评测报告的评测版本为讯飞星火V3.5，而在6月27日，科大讯飞全新发布了讯飞星火大模型V4.0，宣布全面对标GPT-4 Turbo，并在文本生成、语言理解、知识问答、逻辑推理、数学能力等方面实现超越，在国内外中英文12项大模型主流测试集中，讯飞星火在其中8个测试集排名第一。

讯飞星火V4.0带来底座能力提升的同时，全新发布的星火企业智能体平台也成为备受传媒行业欢迎的大模型产品。智能体平台的“任务链”功能可以自动链接外部权威信源，“知识库”功能可以自动链接企业内部知识系统，打通内外信息鸿沟。媒体人士表示：“无论内部信息的纵向挖掘，还是外部信息的横向整合，智能体平台不仅提升媒体行业工作效率，对于从业人员的工作方式也将带来深远影响。”

fund

总分第一！翻译第一！讯飞星火大模型传媒方向评测居首

网址: http://www.kuqiw.cn/news/show-4015.html

下一篇：109亿元定增终止、负债近千亿、经营性现金流告负天合光能如何“过冬”受关注
上一篇：信托风波后股价深跌，新湖中宝“易主”应对？

[ 资讯搜索 ] [ 加入收藏 ] [ 告诉好友 ] [ 打印本文 ] [ 关闭窗口 ]

• 实验室用化学试剂-江苏艾康-专业化学试剂供应-	• 江苏艾康化学试剂采买网站医药中间体库存足
• YK-CMW一氧化碳浓度探测器 PM2.5颗粒物	• 联泰环保控股股东3300万股解除质押，被调查或面
• *ST鹏博多重风险压身，律师征集受损投资者维权	• 茶百道股价突然下跌10%：缺乏核心竞争力，因食
• 闻泰科技支付可转债利息，实控人预处罚已落地或	• 广西平昭高速再迎建设新篇
• 格力地产将召开投资者说明会，已被罚受损股民可	• 亚联发展召开2024年第一次临时股东大会，或还面
• 17年种下一颗“产业信心”，央视报道农夫山泉硬	• 览富资讯2024.7.23
• 奇瑞“智界”二次上市，难现“问界”奇迹？	• A股首例市值退市锁定，今年已有30家上市公司被
• 刘长云大举开店抢滩，九州通卖劣药缘何屡罚难改	• 内卷化加剧，“去侯化”后的金种子酒，能否打赢
• 上半年净利“回血”下半年盈利存疑，面板巨头京	• “多线作战”的农夫山泉和“舆论漩涡”中的娃哈
• 飞鹤发起世界脑健康日系列活动，护航宝宝聪明成	• 硬科技和高成长性获肯定格灵深瞳同时入选科创A