来源:人民日报海外版

4月17日,在日本大阪世博会中国馆,科大讯飞翻译产品总监孙境廷向各国嘉宾介绍讯飞翻译机2.0的功能。
受访者供图

3月27日,在安徽省合肥市科大讯飞人工智能体验馆,科大讯飞演示经理张欣雅展示AI智能产品。
本报记者 杨俊峰 摄

2025年3月,在安徽省合肥市万象城,孩子在科大讯飞工作人员(右一)的指导下体验讯飞AI学习机。
受访者供图
“跨越语言障碍,每个中国人都能带您领略《清明上河图》的盛世烟火;跨越语言障碍,每个英国人都能与您分享莎士比亚十四行诗中的韵律;跨越语言障碍,每个西班牙人都能为您解读圣家族大教堂的设计密码……每种语言都是独特绽放的美丽花朵,在世博会这座人类文明的花园中,我们希望用AI(人工智能)助大家跨越语言障碍。”
4月17日,在日本大阪世博会中国馆,科大讯飞股份有限公司(以下简称“科大讯飞”)AI主持人沐沐现场向各国嘉宾展示科大讯飞最新的AI语音实时同声传译功能,每提到一个国家,沐沐便会切换该国语言,其自然的表情、标准的口型、地道的口音和流畅的表达引发各国观众阵阵惊叹。有外国观众感叹:“中国的AI技术,在大阪世博会的舞台上惊艳了世界。”这一高光时刻的背后,是科大讯飞26年如一日的技术深耕。
成立于1999年的科大讯飞,是一家专注研发智能语音和人工智能的中国科技企业。多年来,科大讯飞一直从事智能语音、计算机视觉、自然语言处理、认知智能等人工智能核心技术研究并保持国际前沿水平。科大讯飞积极推动人工智能源头核心技术研发和产业化落地,致力于“让机器能听会说,能理解会思考,用人工智能建设美好世界”,积极拥抱“智能涌现”的大模型时代。近日,本报记者走进科大讯飞,探寻这家民营企业的创新故事。
AI+沟通
“让每个声音都能被听懂”
“今天给大家介绍我最新拍摄的纪录电影《再会长江》。我用了10年时间记录了中国长江6300多公里的风土人情,想通过一条河来展现中国十年的变化。”
今年4月初,日本纪录片导演竹内亮去法国采风,在巴黎,这位曾经被中国外交部新闻发言人点过赞的日本导演,与一位意大利导演展开了一场“奇妙”的创作研讨会。
研讨会上,竹内亮导演用流利的中文,与意大利导演和他来自世界各地的学生进行了一次跨语种交谈。会场上,中文、英语、意大利语、葡萄牙语等各种语言的声音交织在一起,大家聊得其乐融融,完全不受语种障碍的影响。
促成这一充满科技感的场景变为现实的,是科大讯飞双屏翻译机2.0,基于科大讯飞在关键技术上的突破和应用,这款翻译机搭载星火语音同传大模型,结合其卓越的降噪技术,可以帮助用户在嘈杂环境下实现精准的实时翻译。
“实时翻译是我对这款翻译机最满意的地方,”竹内亮对本报记者说,“翻译的延迟时间只有几秒钟,听众几乎不需要等待就能听到翻译内容,这种语言对语言的实时翻译,把我们开国际会议跨语种沟通的时间缩短了至少50%。”
4月17日,讯飞双屏翻译机2.0在大阪世博会中国馆正式亮相。在向各国嘉宾推荐这款翻译机时,科大讯飞AI主持人沐沐说:“我们相信真正的翻译技术不只是字句的转换,还应成为文明之间对话的引路人。能在世界文明荟聚的舞台上与诸位共同开启人类沟通变革的新篇章,科大讯飞深感荣幸。”
除了语言翻译、拍照翻译外,讯飞双屏翻译机2.0在同声字幕、演讲翻译、录音翻译等新功能上的拓展,使其能更广泛地应用于各种使用场景。
在跨国线上会议场景,“同声字幕”功能可实时双语字幕翻译,帮助用户跟上会议思路并实时参与讨论。在现场提案场景,面对多人的讲解可应用“演讲翻译”,讯飞翻译机搭配领夹麦,双语字幕可呈现在大屏幕上,方便现场多人实时查看。而讯飞双屏翻译机的录音翻译功能,支持回听回看,配合翻译机的导出功能,实现从实时沟通到信息归档的信息管理闭环。
讯飞双屏翻译机2.0是科大讯飞在智能语音技术研发上的一个缩影。在数字化时代,智能语音技术已成为连接人与机器的重要桥梁,它不仅促进了信息交流,还极大地推动了人工智能技术的广泛应用。自创业之初,科大讯飞便立志于实现人机之间的无障碍沟通,通过长期的源头创新和产业化应用,不断推动智能语音技术的发展。
科大讯飞副总裁、消费者事业群常务副总裁赵翔对本报说:“2016年,科大讯飞推出全球首款AI翻译机,开创了一个全新品类。我们的翻译机服务过2022年北京冬季奥运会、2023年布达佩斯世界田径锦标赛和2024年巴黎奥运会‘中国之家’活动。为数百万用户架起文化沟通的桥梁,提供超过10亿次翻译服务,走遍了全球200多个国家和地区。”
在数百万科大讯飞翻译机的用户中,有一位在中国杭州做商用饮水机生意的老板让赵翔印象深刻。他说:“这位老板不会说英语,曾在与外国人的沟通中闹过很多笑话。后来,他用上了讯飞翻译机。再后来,这位平凡的中国创业者,把自己的饮水机卖到了英国伦敦、阿联酋阿布扎比、美国纽约的国际机场。现在,他的公司营收做到了每年2亿元人民币。小小的翻译机,帮助他的生意走出国门,走向世界。”
“在世博园里,大家用讯飞翻译机可以深度体验每个国家不同的文化。走出世博园,拿着讯飞翻译机更可以跨越语言障碍、走遍全球,无论是畅谈跨境生意,还是看遍美好风景,都可以准确快速地与世界各国的人沟通。”赵翔说,“AI技术的发展不仅是为了‘技术更强’,更是为了‘应用落地’时能让每个人、每个企业在这个时代走得更远。在AI技术迅猛发展的今天,我们想向全球伙伴发出邀约:让我们携手努力,让每个声音都能被听懂,让每次交流都充满信任。”
AI+算力
核心源头技术持续突破
研发人工智能,科大讯飞的态度是什么?
科大讯飞董事长刘庆峰对本报说:“在这个时代,信心比什么都重要。一定要有一批人敢于在算法的源头上、未来的核心技术上做创新,有这个胆气、勇气和决心,无论人工智能还是科技产业才有更大的未来。”
近年来,科大讯飞始终把核心源头技术自主创新放在战略高度,每年将营业收入的20%左右用于研发,走过了人工智能发展道路上的一个又一个关键节点:
2008年,首次让机器的语音合成超过普通人说话水平;
2012年,首次让机器的语音评测超过人类专家水平;
2015年,首次让机器的语音识别超过人类速记员水平;
2017年,“智医助理机器人”首次通过国家执业医师资格考试综合笔试测试,并超过96.3%的人类考生;
2018年,首次让机器翻译的中英语音翻译达到CATTI全国翻译专业资格(水平)考试二级合格标准;
2019年,首次在国际权威的机器阅读理解SQuAD2.0比赛中超过人类平均水平;
2022年,首次在OpenBookQA知识推理挑战赛中单模型超过人类平均水平。
依托认知智能全国重点实验室的技术和应用积累,以及成建制的研发团队,2023年5月6日,科大讯飞正式对外发布讯飞星火大模型(以下简称“讯飞星火”),讯飞星火具备文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力等七大核心能力。
2023年10月24日,科大讯飞与华为联合发布了国内首个全国产算力平台“飞星一号”。2024年10月24日,基于全国首个国产万卡算力集群训练的全民开放大模型讯飞星火4.0 Turbo正式发布,根据真实数据背靠背的测试,七项核心能力在中文领域全面超过GPT-4 Turbo,代码能力和数学能力超越GPT-4o;同时,国产超大规模智算平台“飞星二号”正式启动。
2025年1月,业界首个基于全国产算力平台训练的深度推理大模型——讯飞星火X1正式发布,利用更少算力实现业界一流效果;讯飞星火4.0 Turbo底座升级,行业首发混域知识搜索技术;推出业界首个具备端到端语音到语音同传能力的大模型——星火语音同传大模型,最快语音同传时延5秒以内,达到人类专家译员的水平。
2025年4月,讯飞星火X1全新升级,实现了数学、代码、逻辑推理、文本生成、语言理解、知识问答等通用任务效果显著提升,在模型参数比业界同类模型小一个数量级的情况下,整体效果对标OpenAI o1和DeepSeek R1,再次证明了基于国产算力训练的全栈自主可控大模型具备登顶业界最高水平的实力和持续创新的潜力。
2024年,科大讯飞作为第一完成单位的“多语种智能语音关键技术及产业化”项目获得2023年度国家科学技术进步奖一等奖。
“2025年,我最想推动的是完全自主可控的通用人工智能生态体系建设。”刘庆峰说,在他看来,自主可控是AI发展的底气,也是中国在全球竞争中掌握主动权的关键。
AI+行业
持续助力民生和产业高质量发展
如何让因材施教的教育梦想照进现实?如何让一座城市实现和谐可持续发展?如何让一家企业不断提质增效、实现产业焕新?如何让优质医疗资源惠及更多人?如何让一家工业企业实现智能化转型升级?
近年来,科大讯飞一直在AI+行业的探索中,寻找这些问题的答案。
基于人工智能核心技术,科大讯飞多年来持续赋能教育、医疗、金融、汽车、城市、运营商、工业等行业赛道并取得广泛成效,持续助力民生和产业高质量发展。
在教育领域,科大讯飞为5万余所学校、1.3亿师生提供智慧教育产品和解决方案,以人工智能助力因材施教。
在医疗领域,科大讯飞致力为医生打造AI诊疗助理、为居民打造AI健康助手。科大讯飞“智医助理”在全国多个省(自治区、直辖市)、超过670个区县实现了常态化应用,累计辅助诊断达9.1亿次,辅助医生修正诊断超160多万次,提醒不合理处方8600多万次。
在金融领域,科大讯飞已赋能包括国有银行、国有保险集团、股份制银行和头部城商行、农商行在内的200多家金融机构,运用大模型等AI技术提供智能客服、智慧营销、智能风控、代码开发等场景化应用,为客户提升服务体验和运营效能,助力金融高质量发展。
在汽车领域,科大讯飞为一汽、东风、长安、奇瑞、广汽、长城等数十家车企提供座舱智能语音服务,累计前装搭载超6500万套,平均月活用户超过2700万人,年在线交互次数突破168亿次。讯飞座舱智能语音解决方案已覆盖23个海外语种,助力国内车企出海超过60个国家和地区。
在城市领域,科大讯飞为全国330多个城市提供智慧城市解决方案,服务了全国超4900家政企单位,助力城市实现数字化转型。
在运营商领域,科大讯飞提供智慧家庭服务,日语音交互次数达8000万次。通过讯飞星火大模型为运营商用户提供AI速记、AI秘书等智能通话解决方案。
在工业领域,科大讯飞为全国10个省份20多个地市提供基于工业感知、工业认知、工业大模型、能源大模型等工业AI技术的产品和解决方案。目前,在高端装备制造业、能源行业等场景陆续打造出行业示范应用。
科大讯飞承建的智能语音国家人工智能开放创新平台,是国家首批四大新一代人工智能开放创新平台之一。截至2025年3月31日,讯飞开放平台已开放808项AI产品及能力,聚集超过834.3万人的开发者团队,总应用数超过320万,累计覆盖终端设备数超过41.7亿台,AI大学堂学员总量达到80.8万人,链接超过1000万人的生态伙伴。
2023年5月6日,讯飞星火正式发布以来,已新增超过424.9万人的开发者,其中大模型直接相关的开发者人数超过128.7万,企业级用户超过77万人。2024年1月30日,星火开源-13B正式在华为昇思开源社区联合首发上线,这是业界首个基于全国产算力平台“飞星一号”研发的开源大模型。目前,科大讯飞已在全国建设33个人工智能科技孵化器和产业加速中心,孵化了1678家科技创业企业,产值达417.71亿元,为AI创业团队提供产业落地支撑。
“2025年,我们比以往任何时候都更有信心!”刘庆峰表示,讯飞星火的战略生态位非常清晰:坚持自主可控、面向民生刚需以及赋能科研与生产。“聚焦自主可控的底座能力和重点应用赛道,以长期主义精神保持战略定力”,在通用人工智能发展的新阶段,科大讯飞将继续做全栈自主可控的人工智能大模型研发主力军。(记者 杨俊峰 徐靖)
《人民日报海外版》(2025年04月24日第05版)

相关文章:
国家知识产权局:严厉打击抢注“DeepSeek”等相关商标申请行为04-24
用人工智能解锁高质量发展密码(走进民营企业看创新③)04-24
刘国梁总结发言数度哽咽:乒乓球是事业,更是融入血脉的信仰04-23
中国农业发展银行原总监兼内部审计部总经理李光一审被控受贿1624万余元04-23
当选中国乒协副主席后,马龙回应:希望帮助年轻运动员成长04-23