小米AI大模型MiLM-6B首次曝光：64亿参数量，此前称不单独做ChatGPT

小米AI大模型MiLM-6B首次曝光：64亿参数量，此前称不单独做ChatGPT｜钛快讯

2023-08-11 22:23:44来源：金融界

小米总部园区

在小米公司CEO雷军演讲前夕，其研发的人工智能（AI）大模型产品悄然现身。

(相关资料图)

钛媒体App获悉，8月11日，小米公司开发的大规模预训练语言模型MiLM-6B/1.3B登陆代码托管平台GitHub，参数规模最高达64亿，而且现身在C-Eval、CMMLU基准评测榜单。

截至当前，小米大模型MiLM-6B在C-Eval总榜单排名第10、同参数量级排名第1，平均分为60.2分，超过了阿里云Qwen-7B、OpenAI研发的ChatGPT（今年5月数据）等，而MiLM-1.3B排行第30名，平均分45.8分，接近谷歌投资的Anthropic公司的Claude 1.0版本大模型。

这是小米大模型产品的首次曝光，也是小米史上首个GPT大模型产品亮相。

事实上，随着ChatGPT风靡全球，今年4月14日，小米公司宣布成立小米 AI 实验室大模型团队，由栾剑带队向王斌汇报。据悉，AI实验室是小米AI战略的核心部门，而大模型负责人王斌曾在中科院从事了20多年NLP（自然语言处理）相关的研究和开发工作，2018年加入小米，2019年起负责AI实验室。

小米CEO雷军当时表示，公司正在研发一些技术和产品，等打磨好了再给大家演示。小米集团总裁卢伟冰称，小米目前拥有超过1200人的AI团队，会积极拥抱大模型，与业务深度结合，但不会像OpenAI一样。

今年6月，王斌对外透露，小米会去自研通用语言大模型，但不会单独发布一款类ChatGPT产品。他表示，小米第一步的目标基座模型参数在几百亿，而且小米大模型将会落地小爱同学、loT、自动驾驶、机器人等现有场景中，并利用丰富的应用场景反哺大模型能力。

成立仅仅四个月后的今天，小米公布了大模型产品——MiLM-6B，并在C-Eval和CMMLU基准评测上均取得同尺寸较好效果。

其中，在C-Eval评估中，MiLM-6B的平均得分为60.2，在不同学科和难度级别（如STEM、社会科学、人文学科等）得分从42分到71.7分不等。在CMMLU评估中，MiLM-6B在零样本和五样本测试中的平均得分分别为60.37分和57.17分，表现出良好的知识和推理能力。

据悉，C-Eval榜单是清华大学、上海交通大学和爱丁堡大学共同构建的综合汉语模型评估套件，而CMMLU则是综合汉语模型基准。

预计小米将会于8月14日举行2023雷军年度演讲，但目前雷军暂未透露是否会发布MiLM-6B大模型技术。

钛媒体App向团队询问关于MiLM-6B/1.3B是否开源、产品是否已经落地内测等问题，截至发稿前暂未得到小米官方回复。（本文首发钛媒体App，作者｜林志佳）

标签：

精彩推荐

资讯News

聚焦Policy

图集Picture

小米AI大模型MiLM-6B首次曝光：64亿参数量，此前称不单独做ChatGPT｜钛快讯

摄影月赛丨21-骄阳之下（图）

“就是这个声音，让我有一种重生的感觉”大渡河勇救落水者的恩人已找到，被救者送来锦旗

送清凉！安化县教育局开展慰问活动

广工联合湛钢打造低碳冶金创新联合体推进钢铁产业绿色发展

裙子短不短看腿长不长一些上凸下翘的囧图

ios8.1越狱（ios8.0.2越狱）

证监会：深化内地与香港互联互通机制非自动对盘交易将同步开通

节能减排的有效途径！千亿级再生塑料市场，哪些国产厂商已布局？

华宝国际(00336)：集团成员公司合共认购4.675亿元的恒生银行若干金融产品

格科微：副总裁暨核心技术人员李朝勇辞职

保定易县牛岗乡等多个受灾区域移动通信抢通

尿素期货主力合约日内涨4%

从黑马程序员电商视觉设计上半年就业数据，看当下数字产业人才需求热点

瑞银：予太古地产(01972.HK)“买入”评级目标价降至23.3港元

港股内房股反弹中国金茂涨超7%

Epic对苹果App Store支付诉讼以失败告终

理论预测的“恶魔”粒子首次现身，可助揭示超导体工作原理

SK海力士量产 24GB LPDDR5X 内存，一加 Ace 2 Pro 首发

城口携手渝川陕毗邻地区共管跨界河流

事关停车就医，这条出行提示请留意

永远不要做一个廉价的人（看完醒悟）

漫评|相约大运盛会，展现魅力中国

Mysteel：全国高温和强降雨情况汇总（8月3日）

Uber正在全力以赴开发人工智能聊天机器人或用于提升服务质量

安徽疾控：8月，注意防范这些疾病

天际股份抛4.6亿并购交易欲延伸新能源产业链

今后98天，四大生肖生意顺水行舟，生意顺水行舟，财运回归

“掌舵人”离职，OPPO IoT业务何去何从？

京能热力：向控股股东定增募资不超4.26亿元申请获深交所审核通过

中韩（盐城）产业园在沪举办合作恳谈会，聚焦动力电池产业招商

呵护未成年人健康成长（法治头条）

帽子戏法！巴拿马再度手球送点，迪亚妮点射再中，法国5-1领先

广西将恢复至东盟十国首都航线

愤怒的小鸟梦想爆炸什么时候出公测上线时间预告

成都大运会｜篮球——男子9-15排位赛：中国队战胜蒙古队

“来到托管班，每天很欢乐”

环球漫评｜点燃奋斗激情，追梦砥砺前行

外媒：俄无人机袭击对乌多瑙河港口伊兹梅尔造成“严重”破坏

前7月51家企业登陆科创板 41家选标准一4家选标准二

小米AI大模型MiLM-6B首次曝光：64亿参数量，此前称不单独做ChatGPT｜钛快讯

摄影月赛丨21-骄阳之下 （图）

“就是这个声音，让我有一种重生的感觉”大渡河勇救落水者的恩人已找到，被救者送来锦旗

送清凉！安化县教育局开展慰问活动

广工联合湛钢打造低碳冶金创新联合体 推进钢铁产业绿色发展

裙子短不短看腿长不长 一些上凸下翘的囧图

ios8.1越狱（ios8.0.2越狱）

证监会：深化内地与香港互联互通机制 非自动对盘交易将同步开通

节能减排的有效途径！千亿级再生塑料市场，哪些国产厂商已布局？

华宝国际(00336)：集团成员公司合共认购4.675亿元的恒生银行若干金融产品

格科微：副总裁暨核心技术人员李朝勇辞职

保定易县牛岗乡等多个受灾区域移动通信抢通

尿素期货主力合约日内涨4%

从黑马程序员电商视觉设计上半年就业数据，看当下数字产业人才需求热点

瑞银：予太古地产(01972.HK)“买入”评级 目标价降至23.3港元

港股内房股反弹 中国金茂涨超7%

Epic对苹果App Store支付诉讼以失败告终

理论预测的“恶魔”粒子首次现身，可助揭示超导体工作原理

SK海力士量产 24GB LPDDR5X 内存，一加 Ace 2 Pro 首发

城口携手渝川陕毗邻地区共管跨界河流

事关停车就医，这条出行提示请留意

永远不要做一个廉价的人（看完醒悟）

漫评|相约大运盛会，展现魅力中国

Mysteel：全国高温和强降雨情况汇总（8月3日）

Uber正在全力以赴开发人工智能聊天机器人 或用于提升服务质量

安徽疾控：8月，注意防范这些疾病

天际股份抛4.6亿并购交易 欲延伸新能源产业链

今后98天，四大生肖生意顺水行舟，生意顺水行舟，财运回归

“掌舵人”离职，OPPO IoT业务何去何从？

京能热力：向控股股东定增募资不超4.26亿元申请获深交所审核通过

中韩（盐城）产业园在沪举办合作恳谈会，聚焦动力电池产业招商

呵护未成年人健康成长（法治头条）

帽子戏法！巴拿马再度手球送点，迪亚妮点射再中，法国5-1领先

广西将恢复至东盟十国首都航线

愤怒的小鸟梦想爆炸什么时候出 公测上线时间预告

成都大运会｜篮球——男子9-15排位赛：中国队战胜蒙古队

“来到托管班，每天很欢乐”

环球漫评｜点燃奋斗激情，追梦砥砺前行

外媒：俄无人机袭击对乌多瑙河港口伊兹梅尔造成“严重”破坏

前7月51家企业登陆科创板 41家选标准一4家选标准二

摄影月赛丨21-骄阳之下（图）

广工联合湛钢打造低碳冶金创新联合体推进钢铁产业绿色发展

裙子短不短看腿长不长一些上凸下翘的囧图

证监会：深化内地与香港互联互通机制非自动对盘交易将同步开通

瑞银：予太古地产(01972.HK)“买入”评级目标价降至23.3港元

港股内房股反弹中国金茂涨超7%

Uber正在全力以赴开发人工智能聊天机器人或用于提升服务质量

天际股份抛4.6亿并购交易欲延伸新能源产业链

愤怒的小鸟梦想爆炸什么时候出公测上线时间预告