分析与思考
这里记录我在数据、商业、城市与产品问题中的分析过程、方法框架与观察结论。
索引
CourseSnap:从自动截取 PPT,到 PDF 整理,再到 AI 总结
CourseSnap 这个项目,最开始并不是为了做一个完整的 AI 产品。
它的起点其实非常简单:我在上网课或者看回放的时候,不想再手动一张张截图 PPT 了。
很多网课平台不能直接下载课件,而手动截图既低效又容易漏页。所以我最初做的,只是一个工具:自动检测 PPT 页面变化,并自动保存截图。
1. 起点:自动截图
第一版的核心非常简单:
自动检测页面变化 -> 自动截图 -> 保存到文件夹
这个阶段,我解决的只是“如何更高效获取课件”。
2. 第一版流程:截图 + OCR + AI
一开始我就有 AI 总结的想法,所以第一版是:
截图 -> OCR逐张识别 -> 文本 -> AI总结
这里 OCR 是针对每一张图片,而不是 PDF。
但很快出现问题。
3. 为什么放弃 OCR
OCR 的问题:
- 识别不稳定(乱码、漏字)
- PPT结构丢失
- 内容顺序混乱
- AI输入质量下降
让我意识到:
问题不是“提取文字”,而是“保留信息”
4. 关键迭代:PDF
截图多了以后,我发现:
图片太散本身就是问题
于是加入:
截图 -> 一键合成 PDF
带来的变化:
- 保留结构
- 更好阅读
- 更适合 AI 输入
5. PDF 也是独立工具
我没有把 PDF 限制为流程的一部分,而是支持:
- 任意图片导入
- 独立生成 PDF
做了模块解耦
6. AI 总结升级:PDF + 逐字稿
AI 一直存在,但输入变了:
初版:OCR文本
优化:PDF + 逐字稿
逐字稿来源:
- 平台下载
- 或复制到 Word
最终流程:
截图 -> PDF -> PDF + 逐字稿 -> AI总结
7. 逐字稿设计
逐字稿不是自动获取,而是:
- 手动放入文件夹
- 一键打开文件夹
- 自动检测 PDF + TXT/DOCX
- 缺失弹窗提醒
半自动设计:低成本 + 高质量
8. AI 功能定位
AI 需要 API Key(首次输入)
但不是必须:
用户可以用外部 AI 完成
所以它是:
增强功能,而不是门槛
9. 交互设计
我做了基础优化:
- 黄色主按钮 -> 引导操作
- 圆角UI -> 降低技术感
- 弹窗反馈 -> 减少不确定性
目标:
不用学习也能用
10. 中英文版本
后期做了中英文版本,让产品表达更清晰:
自动截图 + PDF + AI总结
11. 工具与工作方式
这是一个 AI-native 开发过程:
- ChatGPT:产品讨论、方案推演
- Cursor:前期开发
- Windsurf:中间切换
- Codex:后期开发与网站集成
- Python / PowerShell:运行调试
- GitHub:项目整理
我在不同工具之间切换,而不是依赖单一平台。
12. 总结
这个项目让我意识到:
产品不是不断加功能,而是不断做取舍
以及:
在 AI 时代,输入和流程,比模型更重要
结语
CourseSnap 从一个自动截图工具,变成了一个完整学习流程产品。
它不是设计出来的,而是在使用和迭代中“长出来的”。