diff --git a/content/posts/LLM Agent is All You Need - 当我用大模型助手来指导我完成MVP产品 - 「Colin's Weekend Project」.md b/content/posts/LLM Agent is All You Need - 当我用大模型助手来指导我完成MVP产品 - 「Colin's Weekend Project」.md index b4d38eb..2b79ff9 100644 --- a/content/posts/LLM Agent is All You Need - 当我用大模型助手来指导我完成MVP产品 - 「Colin's Weekend Project」.md +++ b/content/posts/LLM Agent is All You Need - 当我用大模型助手来指导我完成MVP产品 - 「Colin's Weekend Project」.md @@ -1,7 +1,7 @@ --- -title: LLM Agent is All You Need - 当我用大模型助手来指导我完成MVP产品 - 「Colin's Weekend Project」 +title: LLM Agent is All You Need - 当我用大模型助手来指导我完成 MVP 产品 - 「Colin's Weekend Project」 date: 2025-09-14 -description: 我个人喜欢挑一个周末在一个很短很专注的时间内, 捣鼓点小玩意. 这个栏目用来记录我的这些 idea、作品、创作过程以及吐槽. 今天来挑战一下, 在大模型的指导下, 完成一个最小可行产品(MVP) +description: 我个人喜欢挑一个周末在一个很短很专注的时间内,捣鼓点小玩意。这个栏目用来记录我的这些 idea、作品、创作过程以及吐槽。今天来挑战一下,在大模型的指导下,完成一个最小可行产品 (MVP) categories: - Weekend Project tags: @@ -12,27 +12,27 @@ tags: --- > **「Colin's Weekend Project」** -> 我个人喜欢挑一个周末在一个很短很专注的时间内, 捣鼓点小玩意. 这个栏目用来记录我的这些 idea、作品、创作过程以及吐槽 +> 我个人喜欢挑一个周末在一个很短很专注的时间内,捣鼓点小玩意。这个栏目用来记录我的这些 idea、作品、创作过程以及吐槽 -今天来挑战一下, 在大模型的指导下, 完成一个最小可行产品(MVP) +今天来挑战一下,在大模型的指导下,完成一个最小可行产品 (MVP) ## idea -如果单纯是开发一个完整的 web 程序 or 移动端程序, 其实没啥意思. 我之前已经搞过很多, 更别提日常在公司里面就是在开发各种功能. 今天我打算以一个非专业人士的视角, 探究一下: +如果单纯是开发一个完整的 web 程序 or 移动端程序,其实没啥意思。我之前已经搞过很多,更别提日常在公司里面就是在开发各种功能。今天我打算以一个非专业人士的视角,探究一下: -- 当下各种 AI 助手已经百花齐放, 飞入寻常百姓家. 但是当下的 AI 在真实世界的任务中, 究竟能做到什么地步 -- 如果作为一名非专业人士, 究竟能不能借助这些 AI 工具做出一个可用的产品 -- 如果真正要做一个面向 C 端的产品, 把流程 Run 起来持续下去, 需要考虑哪些因素 +- 当下各种 AI 助手已经百花齐放,飞入寻常百姓家。但是当下的 AI 在真实世界的任务中,究竟能做到什么地步 +- 如果作为一名非专业人士,究竟能不能借助这些 AI 工具做出一个可用的产品 +- 如果真正要做一个面向 C 端的产品,把流程 Run 起来持续下去,需要考虑哪些因素 ## 如果一切都从 LLM 开始... -我需要代入一个非专业开发人员的视角, 来进行这次的项目. 首先项目启动的第一个问题: 在没有任何产品经理的知识, 不懂得产品开发流程的小白的情况下, 我需要如何开始? +我需要代入一个非专业开发人员的视角,来进行这次的项目。首先项目启动的第一个问题:在没有任何产品经理的知识,不懂得产品开发流程的小白的情况下,我需要如何开始? -在没有 LLM 以前, 或许我需要先各种查阅资料学习, 或者各种摇人让懂行的朋友进行指导. 但是现在, 一切都不一样了: 随便一个 LLM 都可以帮我快速入门 +在没有 LLM 以前,或许我需要先各种查阅资料学习,或者各种摇人让懂行的朋友进行指导。但是现在,一切都不一样了:随便一个 LLM 都可以帮我快速入门 -一开始, 我是打算接住 LLM 让我快速了解产品相关的知识. 但是突然觉得, 既然都用 AI 了,为什么还在遵循原有的路径, 一步步自己学习、理解然后教 AI 做事呢? 换个思路, 我只要提供需求, AI 来拆解任务. +一开始,我是打算接住 LLM 让我快速了解产品相关的知识。但是突然觉得,既然都用 AI 了,为什么还在遵循原有的路径,一步步自己学习、理解然后教 AI 做事呢?换个思路,我只要提供需求,AI 来拆解任务。 于是 ![image|476x415](https://blog-1301127393.cos.ap-shanghai.myqcloud.com/BlogImgs/202509172249632.png) @@ -41,13 +41,13 @@ tags: ![image-2|700x472](https://blog-1301127393.cos.ap-shanghai.myqcloud.com/BlogImgs/202509172249634.png) -利用 AI 生成一套提示词, 来指导我如果分析我的需求、拆解任务 +利用 AI 生成一套提示词,来指导我如果分析我的需求、拆解任务 -不得不说, 对于这些跨领域的知识, 能有一个不厌其烦的 AI 助手来循序渐进地跟你交流、帮你分析, 效果非常好. 人类可能还真不好干这个活. +不得不说,对于这些跨领域的知识,能有一个不厌其烦的 AI 助手来循序渐进地跟你交流、帮你分析,效果非常好。人类可能还真不好干这个活。 ## 「AI 教我做产品」 -经过跟这个「MVP 导师」的 LLM Agent 反复沟通, 确定了产品的主要构想和核心事项. 以下是摘录的一部分 +经过跟这个「MVP 导师」的 LLM Agent 反复沟通,确定了产品的主要构想和核心事项。以下是摘录的一部分 ```markdown #### MVP 概要(3 句话) @@ -61,28 +61,28 @@ tags: ## MVP 核心功能: 1. **活动列表**:集中展示多种可入门活动(绘画、球类、手工等)。 2. **入门详情**:点击任意活动 → 展示入门门槛、必备材料、推荐教程链接。 - 3. **埋点追踪**:记录 “点击 → ≥1 min 外部阅读 → 回站” 行为,用于验证假设。 + 3. **埋点追踪**:记录“点击 → ≥1 min 外部阅读 → 回站”行为,用于验证假设。 ``` -这里印象深刻的是, MVP 导师让我先确保用户痛点一定要是真实的, 在初期没有论证的情况下, MVP 的意义就在于基于一个假设(假设用户的痛点是 xxx), 我们要围绕这个痛点先开发出 1-2 个核心功能, 然后通过用户数据分析, 来验证我们关于用户痛点的假设是否成立. 如果不成立说明是伪需求, 也就没有继续投入的必要了. +这里印象深刻的是,MVP 导师让我先确保用户痛点一定要是真实的,在初期没有论证的情况下,MVP 的意义就在于基于一个假设 (假设用户的痛点是 xxx), 我们要围绕这个痛点先开发出 1-2 个核心功能,然后通过用户数据分析,来验证我们关于用户痛点的假设是否成立。如果不成立说明是伪需求,也就没有继续投入的必要了。 -这一点还是让我挺惊喜的, 因为大部分人有个 idea 想做 xx 产品, 大部分都是脑门一热, 想要有 xxx 功能但是其实根本的需求并不是这个. 花了很多精力搞出来的功能其实是伪需求. 而 AI 导师专业水准还是挺在线的, 能够在一开始就识别这个风险 +这一点还是让我挺惊喜的,因为大部分人有个 idea 想做 xx 产品,大部分都是脑门一热,想要有 xxx 功能但是其实根本的需求并不是这个。花了很多精力搞出来的功能其实是伪需求。而 AI 导师专业水准还是挺在线的,能够在一开始就识别这个风险 ## Vibe Coding -接下来就是要进入开发的部分了. 我选择的 AI 代码工具是字节的 Trae 海外版, 不用验证手机号而且可以使用 Google Gemini、OpenAI GPT-4o、Anthropic Claude 4 等高级模型. +接下来就是要进入开发的部分了。我选择的 AI 代码工具是字节的 Trae 海外版,不用验证手机号而且可以使用 Google Gemini、OpenAI GPT-4o、Anthropic Claude 4 等高级模型。 -首先让 AI 根据产品需求文档、拆解任务文档, 确定了技术方案. 不过这里我为了效率简化了下&注入了一些自己的私房调料, 最终使用的方案为: +首先让 AI 根据产品需求文档、拆解任务文档,确定了技术方案。不过这里我为了效率简化了下&注入了一些自己的私房调料,最终使用的方案为: - astro + vue3 + tailwind css 来构建 web 站点 -- directus cms 作为后端,省去编写后端和对接数据库的麻烦 +- directus cms 作为后端,省去编写后端和对接数据库的麻烦 - vercel 快速部署 -这部分没啥好说的, 简单列几个吐槽的点吧: +这部分没啥好说的,简单列几个吐槽的点吧: -- astro 配置 tailwindcss, 换了一圈大模型没一个正确的. 应该是跟近期大版本更新有关系. 最后还是我手动跟着 astro 官方的文档搞定的 -- trae 高级模型试用额度很低, 没写几个功能就超限了开始排队, 动不动前面几百号人基本没法用 -- 现阶段 AI IDE 基本都是基于 vs code 改的. 所以 vscode 的缺点也都一并继承了过来, 很多语言的插件需要额外手动安装、各种变量跳转用不了、各种奇怪的波浪线报错又没法快速修正 +- astro 配置 tailwindcss, 换了一圈大模型没一个正确的。应该是跟近期大版本更新有关系。最后还是我手动跟着 astro 官方的文档搞定的 +- trae 高级模型试用额度很低,没写几个功能就超限了开始排队,动不动前面几百号人基本没法用 +- 现阶段 AI IDE 基本都是基于 vs code 改的。所以 vscode 的缺点也都一并继承了过来,很多语言的插件需要额外手动安装、各种变量跳转用不了、各种奇怪的波浪线报错又没法快速修正 最后简要看下最终的成果吧 @@ -90,37 +90,37 @@ tags: ![image-4](https://blog-1301127393.cos.ap-shanghai.myqcloud.com/BlogImgs/202509172249636.png) -后台数据: +后台数据: ![image-5](https://blog-1301127393.cos.ap-shanghai.myqcloud.com/BlogImgs/202509172249637.png) ## 埋点上报与用户行为分析 -之前做的都是玩具项目和公司内部平台, 没怎么接触过 C 端用户行为分析. 这块确实还是个挺陌生的领域. 不过好在我们有万能的 AI. 在经过埋点需求分析、 技术方案对比、任务拆解之后, 最后采用了 Umami 平台来进行上报, 并简单配置了下指标用于计算用户停留, 辅助验证我们关于用户痛点的假设 +之前做的都是玩具项目和公司内部平台,没怎么接触过 C 端用户行为分析。这块确实还是个挺陌生的领域。不过好在我们有万能的 AI. 在经过埋点需求分析、技术方案对比、任务拆解之后,最后采用了 Umami 平台来进行上报,并简单配置了下指标用于计算用户停留,辅助验证我们关于用户痛点的假设 ![image-6|0x0](https://blog-1301127393.cos.ap-shanghai.myqcloud.com/BlogImgs/202509172249639.png) -跟 MVP 导师沟通的时候,确定了验证假设的方式为: 衡量用户是否点击「查看详情」按钮 +跟 MVP 导师沟通的时候,确定了验证假设的方式为:衡量用户是否点击「查看详情」按钮 - 用户点击并在外部阅读 ≥ 1  分钟后回站 -- 成功阈值: ≥ 25 % 的访问者完成“点击 → ≥ 1 min 回站 +- 成功阈值:≥ 25 % 的访问者完成“点击 → ≥ 1 min 回站 -为了方便统计, 借助 umaimi 的统计功能快速实现, 我只需要统计有多少比例的用户至少点击了一次「了解详情」. 具体到代码实现上, 就是在「点击详情」按钮添加一个上报, 上报内容包括用户的 session id, 后面在 umaimi 统计一段时间内, 按钮点击事件里面, 有多少独立的 session id 处以总的 uv 就可以. +为了方便统计,借助 umaimi 的统计功能快速实现,我只需要统计有多少比例的用户至少点击了一次「了解详情」. 具体到代码实现上,就是在「点击详情」按钮添加一个上报,上报内容包括用户的 session id, 后面在 umaimi 统计一段时间内,按钮点击事件里面,有多少独立的 session id 处以总的 uv 就可以。 ![image-7](https://blog-1301127393.cos.ap-shanghai.myqcloud.com/BlogImgs/202509172249640.png) ## 投放 -众所周知, 天朝桌面端 web 用户已经约等于 0 了, 技术博客都很少人看, 更别提这种泛娱乐向的内容. MVP 导师提供的方案, 也是路线正确, 但是 web 端用户数据反馈验证的路子基本没用. 不过这个 web 页面我也不指望能成为流量主力, 最多算个 wiki. +众所周知,天朝桌面端 web 用户已经约等于 0 了,技术博客都很少人看,更别提这种泛娱乐向的内容。MVP 导师提供的方案,也是路线正确,但是 web 端用户数据反馈验证的路子基本没用。不过这个 web 页面我也不指望能成为流量主力,最多算个 wiki. -要想真的有人看, 收获真实用户反馈, 还是需要到各种新媒体平台去投放的. 然后再收集数据进行分析, 不过这个工作量就是另外一回事了. 运营起来还是需要挺多时间精力的. +要想真的有人看,收获真实用户反馈,还是需要到各种新媒体平台去投放的。然后再收集数据进行分析,不过这个工作量就是另外一回事了。运营起来还是需要挺多时间精力的。 -尝试做了几个图投放到小红书, 放几个示例图 +尝试做了几个图投放到小红书,放几个示例图 ![image-8](https://blog-1301127393.cos.ap-shanghai.myqcloud.com/BlogImgs/202509172249641.png) -用的搞定设计的模版调整了下, 插图是用 Gemini, 效果还可以, 能很好地遵循用户指令, 不过美学方面跟 MidJourney 那些还是差了一截, 毕竟人家专攻的方向. 提示词里面限制好风格的话出图效果还是可以的, 这里后续如果有必要的话, 其实也可以 AI 批量生产插图. +用的搞定设计的模版调整了下,插图是用 Gemini, 效果还可以,能很好地遵循用户指令,不过美学方面跟 MidJourney 那些还是差了一截,毕竟人家专攻的方向。提示词里面限制好风格的话出图效果还是可以的,这里后续如果有必要的话,其实也可以 AI 批量生产插图。 -不过小红书账号冷启动, 反响平平. 这里后续有时间再研究吧 +不过小红书账号冷启动,反响平平。这里后续有时间再研究吧 ## The End