从 Java 后端到 AI Agent:一个普通女程序媛的“跨界”学习实录

16 阅读2分钟

大家好,我是刚毕业的普通本科女生[小紫] 👩‍💻
目前在某地做 AI Agent 开发实习生,正处于从传统后端向 AI 应用方向转型的阶段。

很多人问我:“你之前学 Java 的,怎么突然跑去搞 AI 了?”
这篇就当是我的转型自白 + 学习 Flag。


一、我的背景:Java → 深度学习 → Agent

大学前三年主修 Java 后端开发(SSM / Spring Boot 那套)。
原本计划按部就班找份后端工作,直到大四偶然接触到 大模型(LLM),突然觉得:

“写业务系统是在搬运数据,而 AI 好像在赋予程序‘理解能力’。”

于是我做了一个有点冒险的决定——
毕设没有做传统的管理系统,而是选了深度学习方向:

「基于深度学习的多模态情感分析系统」(文本 + 图像 + 音频融合)


二、毕设踩坑:第一次“炼丹”体验

当时我对深度学习几乎是零基础:

  • 显存爆掉(OOM),训练中途挂掉 💥
  • 数据清洗花了很久,早期准确率还不如随机
  • batch_sizelearning_rate 调到怀疑人生

但当 Loss 曲线终于下降,模型能对一段文字+图片+音频给出合理情感倾向时——
那种成就感彻底让我入坑 ✅
也从那时起确定:要走 AI 应用这条路。


三、为什么选 Agent,而不是纯算法?

我清楚自己不是数学/算法博士,拼不过顶尖研究员。
但我有:

  • ✅ Java 工程化思维(异常处理 / 日志 / 模块化)
  • ✅ 一点点模型训练 & PyTorch 使用经验

AI Agent = 模型理解 + 工程落地,正好契合我的背景:

  • 懂 Prompt / RAG / Tool Use
  • 更需要 API 编排、缓存、并发、部署——这些都是工程强项

对我而言,Agent 是后端转 AI 最自然的切入点


四、现在的状态 & 目标

目前:

  • Agent 框架(LangChain / RAG / Function Call)正在系统学习
  • 工作日实习,晚上挤时间补理论与跑 Demo
  • 技术栈:Python ↑↑↑ ,Java 做底子保留

目标:

  • 成为能独立负责 Agent 项目的 AI 应用工程师
  • 技术成长 + 理性攒钱,走出属于自己的职业路径

五、这个账号会记录什么

我会持续更新 「Java 转 AI 的真实学习过程」

  • 📖 每周一个 Agent 知识点(大白话 + 笔记)
  • 🐛 踩坑记录(报错 → 排查 → 解决)
  • 🎓 毕设相关:多模态训练中的教训与反思
  • 💡 普通女生的技术成长 & 自我提升碎碎念

我还很菜,文章可能有误,欢迎指正 🙇‍♀️
如果你也是从 Java / 测试 / 前端 转 AI 的小伙伴,交个朋友一起卷 🤝

愿我们都能在 AI 浪潮里,找到自己的位置。