feat: new post

This commit is contained in:
2025-09-17 23:02:03 +08:00
parent f718df5a11
commit 9e72f30ff4

View File

@@ -0,0 +1,128 @@
---
title: LLM Agent is All You Need - 当我用大模型助手来指导我完成MVP产品 - 「Colin's Weekend Project」
date: 2025-09-14
description: 我个人喜欢挑一个周末在一个很短很专注的时间内, 捣鼓点小玩意. 这个栏目用来记录我的这些 idea、作品、创作过程以及吐槽. 今天来挑战一下, 在大模型的指导下, 完成一个最小可行产品(MVP)
categories:
- Weekend Project
tags:
- 技术
- JAMStack
- LLM
- AI
---
> **「Colin's Weekend Project」**
> 我个人喜欢挑一个周末在一个很短很专注的时间内, 捣鼓点小玩意. 这个栏目用来记录我的这些 idea、作品、创作过程以及吐槽
今天来挑战一下, 在大模型的指导下, 完成一个最小可行产品(MVP)
## idea
如果单纯是开发一个完整的 web 程序 or 移动端程序, 其实没啥意思. 我之前已经搞过很多, 更别提日常在公司里面就是在开发各种功能. 今天我打算以一个非专业人士的视角, 探究一下:
- 当下各种 AI 助手已经百花齐放, 飞入寻常百姓家. 但是当下的 AI 在真实世界的任务中, 究竟能做到什么地步
- 如果作为一名非专业人士, 究竟能不能借助这些 AI 工具做出一个可用的产品
- 如果真正要做一个面向 C 端的产品, 把流程 Run 起来持续下去, 需要考虑哪些因素
## 如果一切都从 LLM 开始...
我需要代入一个非专业开发人员的视角, 来进行这次的项目. 首先项目启动的第一个问题: 在没有任何产品经理的知识, 不懂得产品开发流程的小白的情况下, 我需要如何开始?
在没有 LLM 以前, 或许我需要先各种查阅资料学习, 或者各种摇人让懂行的朋友进行指导. 但是现在, 一切都不一样了: 随便一个 LLM 都可以帮我快速入门
一开始, 我是打算接住 LLM 让我快速了解产品相关的知识. 但是突然觉得, 既然都用 AI 了,为什么还在遵循原有的路径, 一步步自己学习、理解然后教 AI 做事呢? 换个思路, 我只要提供需求, AI 来拆解任务.
于是
![image|476x415](https://blog-1301127393.cos.ap-shanghai.myqcloud.com/BlogImgs/202509172249632.png)
![image-1|700x472](https://blog-1301127393.cos.ap-shanghai.myqcloud.com/BlogImgs/202509172249633.png)
![image-2|700x472](https://blog-1301127393.cos.ap-shanghai.myqcloud.com/BlogImgs/202509172249634.png)
利用 AI 生成一套提示词, 来指导我如果分析我的需求、拆解任务
不得不说, 对于这些跨领域的知识, 能有一个不厌其烦的 AI 助手来循序渐进地跟你交流、帮你分析, 效果非常好. 人类可能还真不好干这个活.
## 「AI 教我做产品」
经过跟这个「MVP 导师」的 LLM Agent 反复沟通, 确定了产品的主要构想和核心事项. 以下是摘录的一部分
```markdown
#### MVP 概要3句话
- **为谁**2030 岁、周末感到无聊且有意愿尝试新事物的年轻人。
- **解决什么痛点**:不清楚该尝试哪些活动、如何快速入门、活动是否适合自己、以及能获得什么收益。
- **提供的核心功能**:活动列表页面 → 点击感兴趣的活动 → 展示入门门槛与材料推荐(入门材料按钮)并埋点上报。
```
```markdown
## MVP 核心功能:
1. **活动列表**:集中展示多种可入门活动(绘画、球类、手工等)。
2. **入门详情**:点击任意活动 → 展示入门门槛、必备材料、推荐教程链接。
3. **埋点追踪**:记录 “点击 → ≥1min 外部阅读 → 回站” 行为,用于验证假设。
```
这里印象深刻的是, MVP 导师让我先确保用户痛点一定要是真实的, 在初期没有论证的情况下, MVP 的意义就在于基于一个假设(假设用户的痛点是 xxx), 我们要围绕这个痛点先开发出 1-2 个核心功能, 然后通过用户数据分析, 来验证我们关于用户痛点的假设是否成立. 如果不成立说明是伪需求, 也就没有继续投入的必要了.
这一点还是让我挺惊喜的, 因为大部分人有个 idea 想做 xx 产品, 大部分都是脑门一热, 想要有 xxx 功能但是其实根本的需求并不是这个. 花了很多精力搞出来的功能其实是伪需求. 而 AI 导师专业水准还是挺在线的, 能够在一开始就识别这个风险
## Vibe Coding
接下来就是要进入开发的部分了. 我选择的 AI 代码工具是字节的 Trae 海外版, 不用验证手机号而且可以使用 Google Gemini、OpenAI GPT-4o、Anthropic Claude 4 等高级模型.
首先让 AI 根据产品需求文档、拆解任务文档, 确定了技术方案. 不过这里我为了效率简化了下&注入了一些自己的私房调料, 最终使用的方案为:
- astro + vue3 + tailwind css 来构建 web 站点
- directus cms 作为后端,省去编写后端和对接数据库的麻烦
- vercel 快速部署
这部分没啥好说的, 简单列几个吐槽的点吧:
- astro 配置 tailwindcss, 换了一圈大模型没一个正确的. 应该是跟近期大版本更新有关系. 最后还是我手动跟着 astro 官方的文档搞定的
- trae 高级模型试用额度很低, 没写几个功能就超限了开始排队, 动不动前面几百号人基本没法用
- 现阶段 AI IDE 基本都是基于 vs code 改的. 所以 vscode 的缺点也都一并继承了过来, 很多语言的插件需要额外手动安装、各种变量跳转用不了、各种奇怪的波浪线报错又没法快速修正
最后简要看下最终的成果吧
![image-3](https://blog-1301127393.cos.ap-shanghai.myqcloud.com/BlogImgs/202509172249635.png)
![image-4](https://blog-1301127393.cos.ap-shanghai.myqcloud.com/BlogImgs/202509172249636.png)
后台数据:
![image-5](https://blog-1301127393.cos.ap-shanghai.myqcloud.com/BlogImgs/202509172249637.png)
## 埋点上报与用户行为分析
之前做的都是玩具项目和公司内部平台, 没怎么接触过 C 端用户行为分析. 这块确实还是个挺陌生的领域. 不过好在我们有万能的 AI. 在经过埋点需求分析、 技术方案对比、任务拆解之后, 最后采用了 Umami 平台来进行上报, 并简单配置了下指标用于计算用户停留, 辅助验证我们关于用户痛点的假设
![image-6|0x0](https://blog-1301127393.cos.ap-shanghai.myqcloud.com/BlogImgs/202509172249639.png)
跟 MVP 导师沟通的时候,确定了验证假设的方式为: 衡量用户是否点击「查看详情」按钮
- 用户点击并在外部阅读 ≥1 分钟后回站
- 成功阈值: ≥25% 的访问者完成“点击 → ≥1min 回站
为了方便统计, 借助 umaimi 的统计功能快速实现, 我只需要统计有多少比例的用户至少点击了一次「了解详情」. 具体到代码实现上, 就是在「点击详情」按钮添加一个上报, 上报内容包括用户的 session id, 后面在 umaimi 统计一段时间内, 按钮点击事件里面, 有多少独立的 session id 处以总的 uv 就可以.
![image-7](https://blog-1301127393.cos.ap-shanghai.myqcloud.com/BlogImgs/202509172249640.png)
## 投放
众所周知, 天朝桌面端 web 用户已经约等于 0 了, 技术博客都很少人看, 更别提这种泛娱乐向的内容. MVP 导师提供的方案, 也是路线正确, 但是 web 端用户数据反馈验证的路子基本没用. 不过这个 web 页面我也不指望能成为流量主力, 最多算个 wiki.
要想真的有人看, 收获真实用户反馈, 还是需要到各种新媒体平台去投放的. 然后再收集数据进行分析, 不过这个工作量就是另外一回事了. 运营起来还是需要挺多时间精力的.
尝试做了几个图投放到小红书, 放几个示例图
![image-8](https://blog-1301127393.cos.ap-shanghai.myqcloud.com/BlogImgs/202509172249641.png)
用的搞定设计的模版调整了下, 插图是用 Gemini, 效果还可以, 能很好地遵循用户指令, 不过美学方面跟 MidJourney 那些还是差了一截, 毕竟人家专攻的方向. 提示词里面限制好风格的话出图效果还是可以的, 这里后续如果有必要的话, 其实也可以 AI 批量生产插图.
不过小红书账号冷启动, 反响平平. 这里后续有时间再研究吧
## The End