首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
侠客工坊
掘友等级
上海侠客工坊科技有限公司
侠客工坊,xiake.cn将普通安卓手机秒变AI龙虾手机,让AI接管你的手机,自动化操作手机,提高工作效率,解放手机生产力。
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
3
文章 2
沸点 1
赞
3
返回
|
搜索文章
最新
热门
视觉大模型结合Agentic Workflow:侠客工坊重构移动端GUI自动化的技术实践
引言:单纯的大模型控制为何在工业场景频频翻车? 近期,多模态大模型直接控制计算机和手机屏幕的技术方向在行业内引发了巨大关注。从学术界的屏幕解析模型到工业界的端到端操作系统代理,纯视觉驱动的图形用户界面
从指令执行到视觉认知:深度解析AI手机数字员工的技术架构与演进
引言:RPA已死,Agent永生? 在移动互联网的下半场,企业对自动化的需求正经历从基于脚本的确定性任务向基于语义的非确定性决策跨越。传统的移动端RPA严重依赖布局检查器和控件ID,面对频繁更新的AP
DeepSeek-V4 核心能力落地与实战应用指南:从底层机制到多智能体架构复盘
最近,DeepSeek-V4 的发布在开发者圈子里掀起了不小的波澜。无论是在开源中国还是在各类 GitHub 趋势榜上,关于它的讨论居高不下。但脱离了跑分榜单,模型最终还是要落地到真实的业务流中。
首发集成体验:基于 DeepSeek V4 与 OpenClaw 框架,全面重构手机自动化工作流
DeepSeek V4 震撼发布,但大模型的“物理边界”在哪? 科技圈这两天被全新的 DeepSeek V4 彻底刷屏了。无论是在逻辑推理能力、上下文窗口的深度,还是在极具性价比的推理成本上,
大模型与端侧的握手:从0到1拆解“侠客工坊真机AI员工”的底层技术链路
在过去几年里,移动端的自动化经历了从 ADB 脚本、Accessibility 辅助功能到各类手机管理系统的演进。但这些技术都有一个致命缺陷:缺乏“思考”能力。一旦 App UI 发生微调,或者出现弹
从人肉API到数字员工:侠客工坊的企业跨应用流转的 AI 自动化重构
日常办公流中的“人肉 API”困境 在 2026 年的今天,我们在云端拥有了极其强大的大模型算力,但在真实的日常办公场景中,依然存在着一个令人尴尬的割裂感:无数的基层员工每天依然在做着“人肉 Api
告别 API 依赖:探索 Android 边缘节点的非结构化信息抽取与自动化语义交互
移动端封闭生态下的“信息孤岛”困境 在企业数字化转型中,大量的业务协同、客户沟通与高价值的行业信息,都沉淀在各类即时通讯(IM)软件或内部 OA 系统中。由于这些移动端应用普遍采用封闭生态
打破物理距离:构建高吞吐移动端智能体集群的“远程可观测性”与 OTA 热更新
从“单兵作战”到“边缘集群编排”的工程挑战 在探讨 Mobile Agent时,业界往往惊叹于端侧 VLM在单一设备上的“拟人化”屏幕操作能力。
【架构实战】告别 OOM:探索移动端 Agent 长周期任务的“视觉上下文剪枝”与状态持久化
移动端 GUI Agent 的“显存墙” 将设备改造成数字员工,核心是让设备具备“自主看屏幕 + 自主决策”的能力。2026 年最新的架构范式,已经从“外部脚本调用”全面转向了基于多模态大模型
打破端侧黑盒:探索 Mobile Agent 的全链路可观测性与云边协同基建
分布式 Agent 带来的运维灾难与破局 在探讨 移动端智能体时,业界往往将精力集中在如何提升端侧 VLM的感知精度上。但随着技术步入深水区,
下一页
个人成就
文章被点赞
1
文章被阅读
721
掘力值
178
关注了
3
关注者
2
收藏集
0
关注标签
8
加入于
2026-04-05