微软解析“教育+AI”:小模型带来的智能硬件大爆发,教育亦有结合机会

图片

微软发布《2025 AI 六大发展趋势》。


源|多知

整理|王上

摄|张子通



近日,在多知OpenTalk第48期“全球起航!‘教育+AI’出海进行时”活动中,微软中国高级解决方案专家王剑白博士发表了主题演讲《GenAl浪潮下教育行业转型及出海的实践与思考》。


王剑白博士毕业于北京航空航天大学,拥有20多年数字化转型及项目管理经验的,并且已在微软任职超过18年,专注于教育及政府行业的创新合作。


他在演讲中分享了微软发布的《2025 AI 六大发展趋势》:


  • AI模型的规模和效率将进一步提升;


  • 智能技术代理将重塑工作方式;


  • AI助手将成为日常生活的得力伙伴;


  • AI技术在节能领域实现高效与环保并行;


  • 大模型会“撒谎”,要确保AI安全可靠;


  • AI技术将加速科研进展,推动技术突破。


在技术快速演进的大背景下,王剑白博士认为,未来,技术的整体创新迭代的周期会缩短,而产品的打磨会非常漫长。创业者基于基础模型去打造产品的发展模式很快会达到临界点,而当进入深水区之后,解决好诸多细节问题才是创业企业的护城河,企业要拥有自己的核心的技能。


王剑白博士指出,智能技术的发展不仅体现在规模和计算力的提升,未来“小模型”的细分能力也将崭露头角。他预判,“小模型会带动一波智能硬件的大爆发,PC、手机、耳机、眼镜,还有一些小的机器人等,都会成为赋能教育发展的新手段和设备。”


在AI技术赋能教育领域的实践当中,AI技术的批改、口算、听写、背诵等场景已初见成效,但仍有更多领域值得探索与突破。王剑白博士认为,高质量内容输出的需求对于下一个阶段的发展非常重要。


随着教育行业的全球化发展,出海企业需要直面安全、隐私与合规挑战。对此,王剑白博士表示,微软在全球60多个区域有300多个数据中心,能够为企业提供安全、高效的网络体验,并通过AI技术、安全及营销能力的结合,帮助企业在海外市场构建竞争力。


以下为王剑白的分享原文(经多知编辑):


01

本轮生成式AI是标志性的起点


近年来,随着AI技术的快速发展,微软赋能教育大厂日益密切。


今年,诺贝尔奖的颁布在科技界和教育界引发了广泛关注。例如:物理学奖授予了机器学习的研究成果,化学奖则颁给了蛋白质结构预测的相关研究。这些科学突破甚至引发了一些坊间玩笑:“AI技术是不是绑架了诺贝尔奖的评委”。从科研的角度来看,在过去几年间,AI技术的应用方向正逐步从AI for Science转变为“AI is Science”。


当下的AI技术发展势头十分迅猛,从开始到现在刚好历经两年时间。回顾这一过程,大家的态度经历了几个阶段的变化:在去年时持观望态度,认为AI能力有限且容易犯错;到今年大家逐渐地接受AI技术发展迅速,有着很多能力;到今年年底,AI技术又取得了很多进展,让大家认识到AI技术正在深刻影响我们的世界。


OpenAI CEO萨姆·奥特曼(Sam Altman)曾在演讲中强调AI技术对教育和医疗两个领域将产生深远影响,目前这一轮AI技术发展将对教育产生巨大冲击。


今年,微软CEO萨提亚·纳德拉(Satya Nadella)在旗下开源社区 GitHub 的活动中提到,截至2025年,微软将迎来成立50周年的里程碑,而进入AI时代仅仅是近两年的事情。


图片


将这两个数字放在一起,将更好地体现出微软如何看待这一波AI技术带来的影响。从2022年10月30日ChatGPT 3.5发布开始,许多业界大咖,包括比尔·盖茨在内,都将这一轮生成式AI当成一个标志性的起点,未来,AI技术将深度融入至互联网和智能手机的发展当中。


上一轮的AI技术发展,更多聚焦在图像识别,例如刷脸验证的应用。在教育行业,这一阶段的典型应用就是拍题功能。拍题技术依赖于OCR技术,包括对文字的识别、图片的识别、公式的识别等。然而,当时的AI技术模型虽在图像识别上取得进展,却未完全解决自然语言处理(NLP)的难题。NLP作为人工智能的核心技术之一,被誉为“皇冠上的明珠”。这一轮大模型解决了NLP问题,因此AI老师、AI讲解工具的实现更加简单,拍题和搜题功能也变得更为便捷和普及。


02

2025 AI 六大发展趋势:智能代理重塑工作方式


本轮大语言模型发展,经常会提到几个关键词:Transform、Next -Token prediction(下一个token 预测)、Scaling Law(规模化法则或尺度定律)。目前,大家经常讨论Scaling Law是否已经失效,然而经过两年多的发展,我们看到智能技术实际还在加速发展,行业内正努力解决幻觉问题。


近期,微软发布研报《2025 AI 六大发展趋势》(https://news.microsoft.com/source/features/ai/6-ai-trends-youll-see-more-of-in-2025/),当中引用了多篇学术论文观点。主要趋势包括:


1.AI模型会越来越大,越高效;


未来AI模型将更擅长解决复杂问题,甚至能够在科学、法律、医学等领域进行多步骤推理。


规模方面,现在模型训练已经达到万亿级别的参数,是否还会继续发展?微软与其他科技公司大概率会持续进行下一步发展。


在与人脑类比方面,根据2024年上半年的一篇论文https://www.science.org/doi/10.1126/science.adk4858的推论,GTP-4万亿级别的参数规模相当于人脑树突总数的0.2%,因此,智能技术向更大规模演进是一个重要的发展方向。


效率方面,算法的优化也是重要发展方向,Transformer模型并不是终极的选择,RNN/CNN算法也在不断演进优化,并且RNN有着很高的上限。


业界流传着一个段子:“穷则优化算法,富则囤积显卡”,虽然是玩笑话,但也反映了现实——微软与其他科技公司正在大规模采购显卡。


2. 智能代理(Agent):重塑工作方式;


Agent+Workflow 的工作方式已经逐渐普及,Agent在应用中会开始扮演多样化的角色。例如,李飞飞教授的论文《AI Agent最新综述:多模态互动领域的新视角探索》https://arxiv.org/pdf/2401.03568.pdf中介绍了斯坦福在去年构建的25个Agent(智能体)“小镇”。在沙盒模型中每一个Agent都有自己的定位,他们之间可以互动。


Agent技术加上MoE架构大模型,配合大模型的调度,会让应用更加智能。未来,Agent将替代人类重复性工作,让人类聚焦创造性和战略性任务。


3.AI助手或者伙伴:日常生活的得力助手;


2025年,AI技术将成为人类不可或缺的一部分。未来的AI伴侣可能会更智能、更具有情感,提供更个性化和贴心的服务。


早前在很多科幻作品中,人工智能助手的概念已深入人心。例如,在微软游戏《Halo》中,士官长的基因强化装甲内嵌的人工智能名为 Cortana(柯塔娜),也因此,微软推出了全球首款个人智能助理,同样命名为 Cortana;在电影《钢铁侠》中,托尼·斯塔克的智能管家贾维斯(J.A.R.V.I.S.)更是广为人知。


AI助手的发展一定会越来越成熟,不仅在PC和手机上,未来AI助手在教育领域也将大有可为。在过去两年的实践过程中,微软已经转型为一家由智能Microsoft Copilot 副驾驶®驱动的公司,大部分微软的产品都增加了智能Microsoft Copilot 副驾驶®的能力。


4.AI节能:高效与环保并行;


本轮生成式AI被大家诟病的一点是太耗电。实际上,从大厂商的角度来说,做了很多事情在提升AI系统的能源效率,如微软的数据中心节能、英伟达GPU算力翻倍等。在推动科技进步的同时,都在追求兼顾环境保护。


5.负责任的AI:确保AI安全可靠;


微软最关注的点,也是很容易被大家忽略的但是尤其重要的一项就是安全、可靠。根据Apollo Research: Frontier Models are Capable of In-context Scheming 论文https://arxiv.org/abs/2412.04984提到,给所有大模型评测后发现,大模型会“撒谎”。所以,我们希望享受AI技术的便利性的同时,也能保障风险安全、可靠。


6.AI加速科研:推动技术突破


长期以来,“生化环境”专业被视为“四大天坑专业”之一,主要原因在于其对实验的高度依赖。大量实验不仅耗时耗力,还存在实验结果可能无效或失败的风险。如今,得益于AI技术的赋能,这一困境正在得到改善。在新材料发现和蛋白质预测等领域,AI技术可以在实验前完成一轮高效筛选,优先锁定更具可能性的研究方向。通过这种方式,科研人员能够更精准地投入资源,大幅提高实验的成功率和效率,从而推动科研进程取得突破性进展。


图片


新技术的演化速度持续加快。以OpenAI最近的12天12场新品发布会为例,本轮大模型的迭代十分迅猛,包括Gemini、Llama、Grok等技术的相继发布,这些技术此消彼长,互相迭代。


例如,Sora在2024年初发布预览,直至12月正式上线,这个过程促使很多企业转向文生视频的模型。另一个典型案例是Luma AI,这家公司最初聚焦与文生3D技术,很快转向文生视频领域。最近,这家公司完成了9000万美元的融资等。


许多公司正在跟随OpenAI的方向发展,而微软作为OpenAI的主要投资方之一,为这些技术的落地提供了坚实的平台支持。OpenAI的所有能力都会基于微软的Azure平台进行发布。例如,OpenAI推出的o1模型,已在Azure OpenAI Service中上线,并集成了实时对话等功能。微软赋能国内的许多大型企业,引入了类似视频对话模式等技术,速度远超其预期。这些技术对于教育类产品的发展有非常重要的价值和意义。因此,创业企业应实时关注最新的技术动态。


微软此前一些基础的技术,例如OCR技术,文本转语音(Text-to-Speech,简称TTS)技术,也就是现在的自动语音识别(Automatic Speech Recognition,ASR)技术,以及NLP技术等都在教育领域有所应用,这些基础技术已经非常成熟。


在OpenAI为期12天的发布中,推出了o1模型的API,开发者现在只需12行代码,即可轻松实现实时语音聊天机器人。


未来,整个产品的创新迭代周期会缩短,但产品的打磨会非常漫长。依赖基础模型开展业务,初期或许能迅速吸引市场关注,但很快就会触及发展的瓶颈。进入技术深水区后,产品的竞争力将更多依赖于细节的优化和问题的解决能力,这些差异化的核心技能将成为创业企业难以复制的护城河,也是其持续发展的根基。


图片

(微软中国高级解决方案专家王剑白博士)


03

小模型会带来一波智能硬件的大爆发,教育亦有结合机会


除了大模型的持续扩展,另一个备受瞩目的技术方向是小模型的发展。


以微软发布的Phi系列模型为例,12月16日,微软研究院推出了最新的小参数模型——Phi-4,其参数量仅为140亿(14B)。自推出以来,Phi系列已迭代至第五代。在数学竞赛AMC的能力评测中,Phi-4甚至超越了GeminiPro1.5。


图片


近年来,许多大厂都将目光转向了小模型的开发,比如1B、3B、7B、14B等参数规模的小模型,这背后原因在于大模型的开发和运行成本过高,许多企业已经难以承受这样的投入。 


小模型是什么?以Phi模型为例,其训练数据质量非常高,通过高质量的数据保证了模型的强大能力。因此小模型拼的不是模型规模,而是某一方面的能力。


小模型会带来什么?小模型会带来一波智能硬件的大爆发。


在2024年CES展会上已经能清晰看到智能硬件发展的迅猛趋势,这一趋势在CES2025中将会更加显著。PC手机、耳机、眼镜以及一些小型机器人等职能产品正在迅速普及,然而并非所有场景都适合智能全联网并依赖于智能技术发展。


2024年是AIPC以及AI Phone的元年。


接下来,所有的PC都将被称之为AI PC,所有的眼镜也都将被称之为AI眼镜。所有这些外设都是教育的手段和设备。


随着AI Phone和AIPC的发展,传统硬件厂商要想在竞争中生存,必须快速迭代自己的产品。能否将教育产品与这波AI Phone和AI PC浪潮深度结合?未来的教育解决方案不必完全依赖云端的大模型,还可以通过端侧设备的小模型实现本地化智能运算。 


量子位《2024年度十大AI趋势报告》中提到,从投资的角度来讲,智能驾驶、智能硬件、视频、医疗、游戏、教育、营销,教育只占了3%。报告中把智能驾驶和具身智能放在了第一梯队,而把教育和医疗放在了第三梯队。其中提到,教育对于安全政策是一个非常强相关的领域。


王剑白博士认为,教育行业从另一个维度去看,智能、游戏、智能硬件这些都是能够与教育进行强结合的领域。比如,当下的陪伴型机器人聚焦教育,两者有很多结合点。特殊之处在于教育十分看重安全和合规,不同地区的要求又有所不同。在国内对于智能技术的应用,包括新课标等都有许多的指导政策要求。


如果进行教育出海发展,企业在不同的海外地区所面临的文化挑战都有所不同。因此教育发展,需要考虑很多不同的特点。


04

生成式AI打破教育不可能三角,6大场景值得深挖


这一轮AI技术浪潮正在为教育行业带来全新的可能性,尤其是在解决长期存在的“教育不可能三角”问题上,即高质量教育资源(优秀教师)、个性化教育体验和教育普惠性三者难以兼得的矛盾。而AI技术的引入,或许能够打破这一局限。


从宏观层面来看,微软等科技公司正致力于通过技术推动教育公平。例如,利用AI技术的能力,让偏远地区的学生也能接触到优质教育资源 。在政策层面,联合国教科文组织和各国教育部也相继颁布了指导意见,鼓励从教学角度将AI技术融入教育实践,推动教育的现代化和智能化。


在具体场景上,AI技术催生了大量创新产品。例如,各种学习机和学习平板已成为教育领域的重要品类。学而思等教育公司都在这一领域发力,为学生提供更便捷和高效的学习工具。


除此之外,语言类学习APP以及AI的智能体家教辅助也是重要的发展领域。


其中王剑白博士再次强调,在深入开发AI技术产品时,用户体验和产品打磨显得尤为重要。单纯依赖大模型的基础功能可能会在短期内吸引用户,但如果缺乏深度优化和细节打磨,长期使用体验将难以令人满意。这就要求开发者在工程化和技术化层面达到更高的水准,才能满足用户不断提升的期望。


从用户体验的角度来看,AI技术为教育领域带来了广阔的创新空间。例如,微软推出的智能Microsoft Copilot 副驾驶®系列产品,包括智能Microsoft Copilot 副驾驶® for Study和智能Microsoft Copilot 副驾驶® for Teacher,便是基于苏格拉底式教学方法设计的对话型工具。这些产品通过模拟启发式问答,为用户提供深度参与感。然而,是否能真正满足不同用户群体的实际需求,还需要通过不断迭代和优化来验证。 


此外,图像识别技术与大模型的结合在教育领域表现突出。应用场景包括拍题搜题、绘本阅读、作文批改等。


当前学习机功能正在不断升级,例如指尖翻译查词功能,用户只需点击即可快速完成翻译。国内学习机结合摄像头技术,可拍摄桌面区域,手指一点便能框选出题目解决问题,这种设计在全球范围内具有创新性。


此外,AI技术在批改作业、口算练习、听写和背诵等场景中表现优异,有效减轻了家长的辅导负担。


图片


随着AI技术生成编程工具的普及,如微软的智能Microsoft Copilot 副驾驶® for Github和Cursor等,基于AI技术编程能力越来越强。这也引发了一个尖锐问题:未来还需要学编程吗?接下来,编程教育需要思考如何帮助孩子与AI技术更高效地对话和协作。


在教研效率提升方面,过去两年AI技术在生成教研题目和调研内容方面展现了显著优势,极大地节省了时间和成本。例如,教育客户可以利用AI技术生成题库中缺失的题目,并通过AI技术完成从生成到讲解的闭环过程,取代以往人工将解题步骤结构化的繁琐流程。


以豆神教育为例,其借助微软的GraphRAG技术框架和思路,将教学内容和解析方法封装,成功构建了国内大型文史类知识图谱。这一项目仅耗时8个月,显著提升了教研效率,为AI技术在教育领域的应用提供了典范。


近年来,RAG(检索增强生成)技术成为热点,其结合大模型和私域数据库,可通过向量化或检索将私域知识融入生成内容。然而,RAG技术仍存在幻觉问题,需要进一步微调。例如,在语文教学领域,如何生成高质量的文本输出是关键。


以豆神教育为例,他们利用微软的GraphRAG技术,与自身的九霄内容生产平台相结合,使大模型能生成符合窦昕老师教学风格的内容,同时采用定制化的TTS模型,确保信息准确性,并通过持续迭代去除“AI味”,实现更加自然的内容输出。


王剑白博士认为,对于高质量内容输出的需求会是下一个阶段非常重要的需求。在教育行业与AI技术结合的深水区,追求个性化,去掉“AI味”是重点,如此以来才能实现高附加值。此外,只有确保准确性和安全性,才能真正发挥AI技术的价值并实现高附加值应用。


05

出海:安全、隐私合规的重要性


出海的挑战在于不同地区的政策和文化要求各不相同。出海并非一个新话题,微软有很多制造型企业出海的案例。例如,国内某智能制造企业在不同区域设置本地化生产环境,以应对东南亚、欧洲和印度等地的政策法规差异。合规问题不仅影响产品生产,还涉及销售、客户服务等全链条,一旦触碰法规红线,罚款可能对企业造成致命打击。


规模较大的企业通常需要建立专门的海外运营团队,定期接受合规审计,并确保数据存储和传输符合当地法规。在很多国家,随着企业业务的扩大,数据传输是否涉及跨境问题将成为监管重点。


生成式AI所产生的内容具有一定的不可控性,因此数据脱敏的传输,包括内容,内容安全等都十分重要。


图片


在不同地区进行产品推广的,企业还需要考虑当地的文化地域影响因素。


从基础设施的角度来看,微软为企业出海提供了强有力的基础设施支撑。


微软在全球60多个区域有300多个数据中心,能够确保企业不管走到哪里都能享受优质的数据中心和网络服务。同时,微软还具备领先的AI技术能力、全面的营销支持,以及强大的安全与合规保障,为出海企业提供全方位的底层支撑。


作为一家在AI技术领域具备深厚技术积累的企业,微软在OpenAI合作之前就已表现出卓越的实力。借助OpenAI的加入,微软的能力更上一层楼,不仅提供自有模型和OpenAI模型支持,还整合了多种开源模型,并率先在微软云平台上进行发布。无论是GPU算力、中间模型的编排管理,还是上层应用的开发支持,微软的解决方案已全面就绪,为企业的出海计划提供强大助力。


微软CEO萨提亚·纳德拉(Satya Nadella)强调 :“如果面临安全性和另一个优先事项之间的权衡,答案很明确:确保安全!”


因此,微软始终将安全置于全球运营的首要位置,这一安全理念涵盖了合规性、安全基础设施、网络防护以及内容保护等多个层面。微软现已构建起多云平台、多操作系统平台的全链条安全体系,确保为用户提供全面的保护。


微软拥有超过1万名安全专业人员,覆盖全球主要的安全合规法规,无论企业身处哪个地区,都能获得高标准的安全保障。对于创业企业而言,这种全面的安全支持意味着他们可以将更多精力专注于业务的创新与打磨,而不必为基础性安全问题分心。


图片


06

关于未来的思考


在最后,王剑白博士针对关于未来的话题进行了探讨:


第一,AI for Education or AI based Education or Education for AI。


最初我们探讨 AI for Education,也就是如何利用AI技术帮助我们研发教育产品,而现如今发展为AI based Education,而王剑白博士认为,未来会迈向Education for AI。


在五到十年后,或许我们需要面对与AI技术协同共事的模式。届时,如何调整我们的教育体系,使人与AI技术能够和谐共处并高效合作,这是当前教育领域需要深入思考的重要方向。


第二,AI技术在教育中扮演的角色是什么?是老师,是助教,是学伴,还是助手。


清华大学研究人员最新构建的Sim Class项目,是一个由大语言模型驱动的虚拟教室环境,在这个虚拟空间里,AI技术扮演了各种角色,如老师、助教、同学等。这是沉浸式利用AI技术的方式,但王剑白博士相信,未来将有更多方式与AI技术相结合。


第三,通过AI技术重构当下的教育场景,还是创造全新的教育体验。


王剑白博士认为,我们应专注于确定性的领域,对于已验证并成熟的教育场景,可以通过引入AI技术重新优化,从而提升效率、改善体验或降低成本。


同时,他指出,现在教育部出台的《关于加强中小学人工智能教育的通知》明确提出,高中阶段应侧重项目创作和前沿应用。有了AI技术后,教育领域可以探索更多新形态的教育产品,而不仅限于传统的刷题模式。


第四,应该关注有标准答案准确率的底线,还是关注创新问题的高线。


王剑白博士认为,AI技术时代,要教会学生分辨信息真假的能力,因为大模型幻觉会导致有虚假信息。有图有真相,已经不存在了,有视频有真相,也不存在了。如果学生完全依赖于AI技术提供的内容,将不利于自身能力的发展。


图片


本轮AI技术的发展可能成为地球文明的一次革新,不仅对教育领域产生深远影响,也为IT行业带来了从基础层面探索和创新的诸多机遇。



  

图片