一、AI眼镜概述 AI眼镜是一款新型的可穿戴设备,是在普通眼镜的基础上增加AI功能而来的产品,被认为是从传统眼镜向AR眼镜迭代的一款过渡产品。以现在关注度较高的MetaRay - Ban第二代产品为例,其重量仅为49g,有着较好的佩戴舒适度,这使得它可以突破过往VR主要用于室内空间的限制,被广泛应用于室内外的日常场景中。从功能看主要用于语音交互和拍摄。
例如MetaRay - Ban是一个多模态人工智能产品,用户能通过“Hey Meta”指令唤起AI,可以查询天气、时间、体育比赛、新闻节目等日常基础信息,并且可以使用“HeyMeta,look And...”指令调用摄像头,来实现更多视觉化操作,如识别冰箱里食材可做的菜谱、穿搭建议、识别建筑物、查询花园植物浇水量等,除此之外,还支持拍摄、音乐与通信功能,它采用开放式耳机扬声器,可以通过指定歌手、歌曲、曲风等进行语音交互。
像创维数字搭载AI功能的轻交互AR眼镜,采用Micro - OLED显示屏达到1920x1080高清显示,产品通过OTT盒子计算与处理,AR眼镜进行NLP交互及画面呈现,可连接手机、OTT盒子 + 音响畅享高清大屏观影、支持游戏机输出,可用于观影、会议办公、大屏阅读、线下娱乐体验等。
二、AI眼镜的应用领域 (一)日常生活领域
- 导航出行:AI眼镜能够通过语音和手势交互方式实现导航路线的规划与指引,无需借助手机,并且如果导航精度进一步提高,加入红外或激光感应装置,还有可能解决盲人出行问题。操作便捷且方便人们在移动过程中获取路线信息,尤其适用于骑行或者步行状态下的导航场景,提升出行的便利性和安全性。
- 消息提醒与办公事务:可以替代部分手机的功能,如接收消息提醒和进行简单的办公处理,像日程提醒、邮件通知等,还能进行远程会议通话,这有助于人们摆脱对手机随时随地查看信息以及对电脑从事简单办公场景的依赖,提高事务处理的效率。
- 语言翻译:在身处外地语言不通的情况下,可提供智能翻译功能,起到智能助理的作用。在出国旅行或者跨国商务交流中,能打破语言障碍,即时进行不同语言的转换,便于人们之间的沟通交流。
- 娱乐视听:一些AI眼镜可以在用户下达指令后播放音乐,并能按照用户的喜好选择歌手、歌曲、曲风等,为用户提供个性化的音乐聆听体验;同时,部分产品也具备类似于AR眼镜的观影功能,能让用户在眼镜上观看视频内容,提供了不同于传统手机和电视的观看体验便捷。
(二)医疗领域
- 辅助诊断:参照之前AI在医疗领域的应用情况,AI眼镜也有可能通过影像分析等辅助经验丰富的医生进行疾病诊断,以提高诊断的准确性和效率。例如可以直接识别视觉范围内皮肤的病变特征,提示医生可能的疾病类型和应对方案等,有助于医生获取更多信息来做出判断。
- 健康监测:在未来,AI眼镜有可能直接实时监测用户的健康指标,例如心率、血压等,当参数出现异常时及时向用户或医生预警并提供健康管理建议。这对于患有慢性疾病需要日常健康管理的人群以及在户外活动或者工作过程中的人员健康预警有着重要意义。
(三)教育领域
- 语言学习与教学辅助:在语言学习方面,可充当随身助理,随时为使用者提供语言发音纠正、单词解释等辅助学习服务。例如学生在学习外语过程中,遇到不会的单词,可以直接询问AI眼镜快速得到解答。在教学过程中,教师可以利用AI眼镜提供的更广泛的知识获取能力为教学内容做补充,例如进行历史事件场景还原展示等。
- 个性化学习方案定制:AI眼镜可以依据每个学生的学习进度、能力水平、学习习惯等达成个性化学习方案的定制,比如根据学生的课程掌握情况推荐相适应的学习内容,这种方式最大程度满足不同学生多样化的学习需求,有助于提高教学的针对性和学生的学习效果。
(四)工业领域
- 生产流程监测与故障排查:工人在生产过程中可以通过AI眼镜实时查看生产流程信息和设备的运行状态,包括设备的一些详细技术参数、生产线上各个环节的进展情况等。一旦设备出现故障或者生产流程偏离正常轨迹,AI眼镜可以及时提示并且提供故障排查的基本思路和解决方案,有助于提高工业生产的效率和保证产品质量的稳定性。
- 远程协作:在一些大型设备的维修或者需要专家指导的复杂工业场景中,不同地点的工作人员可以通过AI眼镜进行远程协作。例如身处外地的专家可以借助看到现场工作人员看到的场景,从而准确地指导现场人员进行设备的维修或者操作任务,提高解决问题的时效性和准确性。
三、AI眼镜在大模型中的作用 (一)作为大模型的交互接口
- 实现便捷的语音交互:基于大模型的AI眼镜可以理解用户发出的自然语言语音指令。例如以MetaRay - Ban为例,用户通过“Hey Meta”这样的语音指令唤起AI并进行对话操作。这为用户与大模型之间的交互提供了一种自然且方便的方式,用户无需手动输入文字,解放了双手,类似于一个可穿戴式的语音助手,大大提高了用户交互的便捷性。
- 多模态交互补充:很多AI眼镜具有拍摄功能等硬件能力,结合大模型就可以实现多模态交互。举例来说,用户可以通过眼镜摄像头拍摄某个物体,然后大模型根据拍摄物体图像结合语音提出的问题进行回答或提供相关分析、建议等,例如拍摄冰箱食材后询问可以做什么菜这类的交互。这种多模态交互丰富了用户和大模型之间的信息传递方式,使交互更加直观、高效。
(二)使大模型功能在终端侧落地
- 提高大模型应用效率:大模型的能力嵌入到AI眼镜这种可穿戴设备,让用户能随时随地使用大模型的功能。就像如果大模型提供翻译功能,那么在AI眼镜上使用就可以第一时间满足在外出行者即时翻译的需求,避免人们打开手机应用寻找翻译软件的繁琐过程,提高了大模型相关应用功能实现的即时性和效率。
- 据用户场景优化功能输出:由于眼镜可以获取用户的第一视角等情境相关信息,大模型结合这些信息进行交互时可以输出更符合用户实际场景需求的结果。例如基于所处环境的光线、位置、识别到的场景类型(办公环境、休闲环境)等调整提示内容。以智能办公场景为例,如果用户在办公室环境查看眼镜,并且当天是周一,大模型可结合用户日历信息等内容在AI眼镜上提醒用户本周工作任务或者安排近期会议日程这些对应用户场景定制化信息。
(三)推动大模型的应用拓展
- 开辟新的应用场景模式:大模型和AI眼镜的结合为很多产业开拓出新的应用场景模式。在医疗场景下,就可能出现医生佩戴AI眼镜在手术过程中利用大模型的辅助分析手术部位状况并给出指导等新的医疗应用方式;在教育场景会促使创新教学方法,如老师利用大模型知识生成能力结合AI眼镜多模态展示为学生提供前所未有的沉浸式教育体验。
- 创新消费体验:对于普通消费者来说,戴有大模型支持功能的AI眼镜能够体验到更多新颖的交互乐趣。比如当消费者看到一个漂亮的风景或者建筑,通过AI眼镜连接大模型直接就可以获取关于这个风景建筑背后的历史、文化、趣闻等大量信息 ,从而拓宽了大模型的消费级应用边界,挖掘出更多大模型面向消费级市场可应用的模式。
四、AI眼镜成为新风口的原因 (一)技术发展的推动
- AI技术本身的进展:人工智能技术在语音识别、自然语言处理、图像识别等多个技术领域取得显著成果,为AI眼镜的发展奠定了基础。例如强大的语音交互技术使得AI眼镜能够准确理解用户的语音指令,自然语言处理技术使AI眼镜可以和用户进行较为复杂对话交互,图像识别能够让它在物品识别、场景分析上大展身手。
- 硬件技术的优化:在光学、芯片、电池等硬件技术上不断优化。光学方面,轻量化、高清晰度显示技术的发展既保证了用户视觉体验又减轻了眼镜的重量;芯片技术进步使得芯片的运算能力提升且功耗降低,例如高通推出的骁龙AR1Gen1就为AI眼镜侧AI提供了算力支持;电池技术一定程度上虽然还面临挑战,但在朝着低功耗方向努力,也不断延长着眼镜的续航时间,像小米等品牌在电池技术研发方面也有持续投入。
(二)市场需求的刺激
- 消费者对便捷智能设备的渴望:现代消费者越来越追求便捷、高效且智能化的设备。AI眼镜在一定程度上整合了多种功能,可以满足消费者不想携带过多电子设备以及想随时方便获取信息的需求。例如在运动场景下,消费者不想携带手机去听歌或者获取运动指南,AI眼镜就可以充当轻便的智能设备满足这些需求。
- 不同行业对智能化装备的需求:除了消费者层面,各行业如医疗行业希望提高诊断效率(眼镜在辅助医疗诊断方面有潜在应用空间)、教育行业希望创新教学方法(沉浸性的AR教育体验可能借助眼镜实现)、工业行业希望提高生产效率和远程协作能力等,都在寻求智能化的装备支持,这些行业需求都为AI眼镜的发展提供了市场拉力。
(三)大厂布局的带动
- 国际大厂引领风向:苹果、Meta、谷歌等国际科技巨头纷纷布局AI眼镜市场。Meta在AI眼镜领域推出Ray - Ban系列产品取得了不错的市场反应,例如MetaRay - Ban第二代产品带动了月活数量大幅增长、7月激活量月环比增长25.2%,预计全年出货量可能超150万副且持续缺货,这无疑让整个市场看到了AI眼镜的潜力。
- 国内厂商跟进热潮:国内厂商也积极跟进,华为、小米、百度等相继推出相关产品或者计划涉足AI眼镜领域。如百度计划推出内置基于文心基础模型构建的语音交互功能且带有摄像头的AI眼镜;小米之前在其他智能穿戴设备有过布局经验且对风口较敏感,国内厂商的这些举措表明他们认可AI眼镜作为新的发展方向,这进一步助长了AI眼镜成为风口的趋势。
五、AI眼镜未来的发展趋势 (一)技术革新
- AI算法与硬件的深度融合:
- 未来AI算法会针对AI眼镜的硬件特点进行深度优化。例如在现有的语音识别算法基础上,进一步优化以适应不同噪声环境下AI眼镜的使用场景。比如说,在喧哗的街道和安静的会议室都能准确识别语音指令。
- 硬件设备也会随着算法优化而升级,芯片会专门针对AI眼镜上的算法计算需求而制造,更加适应深度神经网络这类AI算法的计算,提高执行效率且进一步降低功耗。像为了更好的处理视觉数据如识别街景中的店铺名称之类功能,GPU芯片技术也可能会集成到AI眼镜或者其辅助设备中。
- 增强现实与虚拟现实技术的融合(AR与VR融合):
- 在硬件层面会朝着支持AR、VR功能融合的方向发展。例如开发出一种能够快速切换显示模式(从AR到VR以及中间过渡状态)的光学镜片技术。这种镜片技术可能基于电、光等调控装置,可以改变光线折射路径从而实现不同显示模式的切换。
- 在软件层面开发出融合性的交互界面,当在AR模式下可以像传统AI眼镜一样进行各种操作(如语音交互、使用摄像头进行信息获取等),切换到VR模式时,交互界面变为沉浸式的虚拟环境交互场景,但是仍然可以和之前在AR下的操作逻辑有一定的延续性,例如在VR场景下仍然可以调用之前AR状态下记忆的地理位置等信息来做相关交互或者任务(如基于之前观察到的地理位置进行定向的VR游戏任务设定)。
- 低功耗与长续航技术:
- 电池技术将继续朝着小体积、高能量密度的方向研究。例如研发新型的锂 - 空气电池或者固态电池技术应用到AI眼镜上,这种电池类型有可能在减小电池体积的同时大大提高电池的电量存储。
- 在AI眼镜的电源管理系统方面也会不断优化,开发智能化的电源管理算法,采用动态调整不同组件功耗的策略。比如在语音交互功能闲置一段时间后自动降低麦克风及其相关电路模块的功耗,以及根据光线情况自动调整显示屏幕的亮度从而降低电力消耗等措施,提高能源利用效率。
(二)应用场景扩张
- 深入日常生活更多领域:
- 在家庭生活场景中成为智能家居的中控设备。用户可以通过AI眼镜控制家里的智能家电设备,查看智能摄像头监控画面,进行家庭安全监控预警等操作,真正将智能生活集成到一个可穿戴设备上。
- 在旅游场景下成为智能导游,不仅能提供导航、翻译这些基本功能,还可以根据用户所在位置,实时推送当地的历史文化景点信息、美食推荐,以及在参观博物馆等场所时提供AR文物介绍等个性化的旅游服务。
- 在新兴行业崭露头角:
- 在航空航天领域,协助宇航员或者地面指挥人员在太空探索或者航天设备监控过程中,提供即时数据解读、远程协作沟通等服务。例如在应对空间站设备故障排查时宇航员可以获得来自地球上专家团队第一视角指导等。
- 在新兴的创意产业如沉浸式广告、虚拟艺术创作等方面,AI眼镜可以提供全新的创意展示和互动方式。例如观众可以通过AI眼镜在观看广告时进入到一个和广告内容主体相关的专属AR或者VR体验场景中,提高广告的吸引力和效果;艺术创作者可以利用眼镜在任何真实场景下快速获取灵感并且利用AI辅助进行虚拟艺术创作过程(如在真实风景上叠加虚拟绘画元素等)。
(三)用户体验优化
- 轻量化与舒适性设计:
- 采用新型材料如记忆合金、超轻量的碳纤维等用于制作镜架,使眼镜既坚固又轻盈。镜架的形状也会更加符合人体工学原理,根据不同脸型和头部形状提供舒适的佩戴体验,减少因长时间佩戴造成的压迫感等不适。
- 对于镜片部分,除了考虑视觉光学性能的提升,也注重镜片的佩戴舒适性,如降低镜片的厚度、重量以及提高镜片的透氧性等,让用户感觉镜片就像普通的近视或者远视镜片一样自然舒适。
- 隐私保护与安全防护:
- 在软件层面利用加密技术保护用户的语音指令录入、视觉数据采集等交互过程中的隐私信息。例如采用端到端的加密算法保证用户语音指令在发送到云端服务器或者本地执行单元过程中不被窃取或篡改。
- 在硬件层面可能会研发类似生物识别技术来增强设备安全性,例如采用虹膜识别技术确保只有授权用户可以使用眼镜的相关功能,防止他人冒用用户设备窃取敏感信息。
- 智能化交互体验:
- 不断改进语音交互功能,使语音助手更加智能。例如对话交互能够识别用户的情绪状态、调整回答的语气和内容风格;并且可以对用户的语音指令进行模糊处理,理解不规范表达方式下的真实需求。
- 手势识别、眼神控制等新型交互方式将更加成熟。例如用户可以通过简单的手势操作在视野里直观地控制菜单界面,还可以通过眼神凝视特定区域实现选择或者信息确认功能等,形成多通道全方位更加自然流畅的交互体验。