Fan Chen

分析与思考

这里记录我在数据、商业、城市与产品问题中的分析过程、方法框架与观察结论。

数据分析商业判断城市观察产品思考

索引

CourseSnap:从自动截取 PPT,到 PDF 整理,再到 AI 总结

2026-04-22AI产品产品思考工具实践

CourseSnap 这个项目,最开始并不是为了做一个完整的 AI 产品。

它的起点其实非常简单:我在上网课或者看回放的时候,不想再手动一张张截图 PPT 了。

很多网课平台不能直接下载课件,而手动截图既低效又容易漏页。所以我最初做的,只是一个工具:自动检测 PPT 页面变化,并自动保存截图。


1. 起点:自动截图

第一版的核心非常简单:

自动检测页面变化 -> 自动截图 -> 保存到文件夹

这个阶段,我解决的只是“如何更高效获取课件”。


2. 第一版流程:截图 + OCR + AI

一开始我就有 AI 总结的想法,所以第一版是:

截图 -> OCR逐张识别 -> 文本 -> AI总结

这里 OCR 是针对每一张图片,而不是 PDF。

但很快出现问题。


3. 为什么放弃 OCR

OCR 的问题:

  • 识别不稳定(乱码、漏字)
  • PPT结构丢失
  • 内容顺序混乱
  • AI输入质量下降

让我意识到:

问题不是“提取文字”,而是“保留信息”


4. 关键迭代:PDF

截图多了以后,我发现:

图片太散本身就是问题

于是加入:

截图 -> 一键合成 PDF

带来的变化:

  • 保留结构
  • 更好阅读
  • 更适合 AI 输入

5. PDF 也是独立工具

我没有把 PDF 限制为流程的一部分,而是支持:

  • 任意图片导入
  • 独立生成 PDF

做了模块解耦


6. AI 总结升级:PDF + 逐字稿

AI 一直存在,但输入变了:

初版:OCR文本

优化:PDF + 逐字稿

逐字稿来源:

  • 平台下载
  • 或复制到 Word

最终流程:

截图 -> PDF -> PDF + 逐字稿 -> AI总结


7. 逐字稿设计

逐字稿不是自动获取,而是:

  • 手动放入文件夹
  • 一键打开文件夹
  • 自动检测 PDF + TXT/DOCX
  • 缺失弹窗提醒

半自动设计:低成本 + 高质量


8. AI 功能定位

AI 需要 API Key(首次输入)

但不是必须:

用户可以用外部 AI 完成

所以它是:

增强功能,而不是门槛


9. 交互设计

我做了基础优化:

  • 黄色主按钮 -> 引导操作
  • 圆角UI -> 降低技术感
  • 弹窗反馈 -> 减少不确定性

目标:

不用学习也能用


10. 中英文版本

后期做了中英文版本,让产品表达更清晰:

自动截图 + PDF + AI总结


11. 工具与工作方式

这是一个 AI-native 开发过程:

  • ChatGPT:产品讨论、方案推演
  • Cursor:前期开发
  • Windsurf:中间切换
  • Codex:后期开发与网站集成
  • Python / PowerShell:运行调试
  • GitHub:项目整理

我在不同工具之间切换,而不是依赖单一平台。


12. 总结

这个项目让我意识到:

产品不是不断加功能,而是不断做取舍

以及:

在 AI 时代,输入和流程,比模型更重要


结语

CourseSnap 从一个自动截图工具,变成了一个完整学习流程产品。

它不是设计出来的,而是在使用和迭代中“长出来的”。