最后更新:2026-06-22 项目状态:规划设计阶段
为臻(7-8岁)和勤(5岁)打造一个AI驱动的家庭教学系统,以聊天、游戏、视频等方式覆盖英语、国学、数学、物理、表达等能力。系统跑在 Mac mini 服务器上,通过 iMac 终端访问,家长可远程管控使用时间和内容。
核心理念:不是让孩子戒掉刷手机的习惯,而是让他刷我们精挑细选的有用内容。
┌─────────────────────────────────────────────────────┐
│ 用户终端层 │
│ iMac(臻&勤的电脑) │
│ ├── 独立用户账户(屏幕使用时间管控) │
│ ├── Safari →「臻&勤学习中心」Web端 │
│ ├── 麦克风/摄像头 → 语音交互 + 手指比划识别 │
│ └── 键盘鼠标 → 答题/操作 │
└────────────────────┬────────────────────────────────┘
│ HTTP/WebSocket
┌────────────────────▼────────────────────────────────┐
│ 服务端(Mac mini) │
│ │
│ ┌─────────────┐ ┌──────────┐ ┌───────────────┐ │
│ │ 教学Agent │ │ 知识库 │ │ 用户管理系统 │ │
│ │ (Hermes+ │ │ (ThinkRead│ │ (账号/权限/ │ │
│ │ 自定义角色) │ │ 知识库) │ │ 进度/积分) │ │
│ └──────┬──────┘ └────┬─────┘ └───────┬───────┘ │
│ │ │ │ │
│ ┌──────▼──────────────▼────────────────▼────────┐ │
│ │ 数据层 │ │
│ │ ├── 刷学宝视频库(YouTube/自制教学视频清单) │ │
│ │ ├── 记忆王者题库(古诗/古文/单词) │ │
│ │ ├── 数理化故事体系(故事→概念→应用映射) │ │
│ │ ├── 树莓小车编程闯关体系 │ │
│ │ ├── 表达训练题库(看图说话/复述/即兴演讲) │ │
│ │ ├── 学习进度数据库(每人每科进度) │ │
│ │ ├── 成就/激励系统(积分/连胜/段位/装扮) │ │
│ │ └── 每日任务配置 + 家长管控规则 │ │
│ └─────────────────────────────────────────────────┘ │
│ │
│ ┌──────────────┐ │
│ │ LLM后端 │ DeepSeek API / 本地模型 │
│ └──────────────┘ │
└──────────────────────────────────────────────────────┘
定位: 全屏竖版刷视频模式,但内容只有教学视频。
视频来源: - YouTube精选少儿频道(Super Simple Songs、Cocomelon、Numberblocks、Peppa Pig、Arabian Kids 等) - 家长自制教学视频(录制教字母/数字的片段) - 抖音/其他平台筛选的有效教学内容
分类: - 英语字母发音(ABC Song、Phonics) - 阿拉伯语字母(Arabian Kids、Arabic Alphabet Song) - 数字/数数(Numberblocks、计数歌) - 颜色/形状 - 动物/日常词汇
特色交互: - ✅ 全屏竖屏、上下滑动切换 - ✅ 看完后弹出互动小问答 - ✅ 摄像头识别手指比划字母→即时反馈奖励 - ✅ 语音跟读→识别→鼓励/纠正 - ✅ 零广告、纯白名单内容
管控: 每日配额时间,到点自动锁定。
定位: 每日早读晚读的背诵复习中心。
现有基础: thinkread.top/memory-review(已上线,纯前端+localStorage,支持古诗词/英语单词,双账号PK,成就系统)
升级方向: - [ ] 与教学 Agent 打通:Agent 早读教新诗→存入记忆王者→晚读自动复习 - [ ] 双账号PK升级:臻和勤互相挑战背书,胜者得积分 - [ ] 间隔重复算法:按照遗忘曲线安排复习 - [ ] 古诗分级体系: - L1:五言绝句(咏鹅、静夜思、春晓) - L2:七言绝句(望庐山瀑布、早发白帝城) - L3:律诗/小古文(陋室铭、爱莲说节选) - L4:长篇/论语节选 - [ ] 多学科扩展:英语单词、数学公式、科学常识 - [ ] 云端存储:从 localStorage 升级到后端,跨设备同步
早读晚读流程:
早读(5-10分钟):
Agent:"早安臻,今天我们读一首新诗。"
→ Agent 讲故事背景(诗意)
→ 跟读3遍
→ 孩子独立朗读
→ 存入记忆王者:新诗待背
晚读(5-10分钟):
Agent:"晚上了,复习时间到。"
→ 记忆王者打开 → 复习昨日+今日内容
→ 全对 → 积分+连胜
→ 有错 → 记录弱点,明天再背
定位: 从"字母歌/数数"升级到真正的口语对话。
勤(5岁): - ✅ 26个字母大写基本认全 - ✅ 英语数字从1数到100无压力 - ✅ 能读出4021、4022等四位数(已理解千位→百位→十位→个位的位值结构) - 🇦🇪 对阿拉伯语字母也有兴趣 - ❗ 下一步:从认读词汇升级到口语对话输出
臻(7-8岁): - 🔶 可能学校教了基础词汇和简单句子 - ❗ 口语输出机会少,需要从开口练起 - ✅ 认知能力强,理解力和记忆力优于勤 → 学习节奏可以更快 - 起点也和勤一样从L0开始,但进度预计快1-2倍
| 级别 | 适合 | 内容 | 目标 |
|---|---|---|---|
| L0 - 口语起步 | 勤 | 日常问候、简单指令、I like/I have句型 | 能回应3-5个简单问题 |
| L1 - 日常对话 | 勤→臻 | 购物/学校/家庭场景、What/Where/How many | 能进行5轮对话 |
| L2 - 故事听说 | 臻 | 短故事听读、复述大意、看图描述 | 能讲一个短故事 |
| L3 - 观点表达 | 臻 | 表达喜好/原因、描述经历 | 能表达观点并给理由 |
| L4 - 自主读写 | 臻 | 分级阅读、拼写、短作文 | 校内英语轻松应对 |
Agent 每天切换英语模式进行对话:
① 日常对话(每天一次,5分钟)
Agent: "Good morning, Qin! How are you today?"
→ 勤需要回应,Agent 逐级提示
→ "I'm happy!" → "What color is your shirt?" → "Can you say 'My shirt is blue'?"
→ 利用勤的数字优势扩展:
"How many fingers do you have?"
"How many stars are in the sky tonight?"
"Can you count from 1 to 20 backwards?"
② 场景角色扮演(每周一个主题,Agent 扮演角色)
Week 1: At the Zoo → 买票、看动物、描述颜色大小
Week 2: Shopping → 买水果、问价格、数零钱
Week 3: My Family → 介绍家人、描述长相
Week 4: Weather → 今天天气、穿什么衣服
Week 5: Restaurant → 点餐、说想吃什么
Week 6: Review Party → 综合场景自由对话
③ 数字深度利用(勤的特殊优势)
不满足于简单数数,用数字做跳板引入真实对话:
"There are 4021 ants!" → 利用勤能读大数字的优势 →
"Now let's talk about what ants eat…"
"How many apples do I have? I have 3. How many do you want?"
→ 从数字自然过渡到"I want…"句型
| 周 | 新内容 | 对话主题 | 目标句子 |
|---|---|---|---|
| 1 | Greetings + Numbers | 早上好、你几岁 | "I'm 5 years old" |
| 2 | Colors + Animals | 你最喜欢的颜色/动物 | "I like blue / I have a cat" |
| 3 | Food + Drinks | 想吃什么 | "I want an apple" |
| 4 | Family | 介绍家人 | "This is my brother Zhen" |
| 5 | Actions | 描述动作 | "I can run / jump / sing" |
| 6 | Role Play | 综合场景 | 综合运用前5周 |
定位: 不是主课,拼读练习为主,不要求系统性学习。
每周2-3次,每次5-10分钟:
└── 阿拉伯语字母表拼读(ت ب ا 等基础字母)
└── 简单词语发音练习
└── 在刷学宝里看阿拉伯语字母视频(自由刷)
Agent 不主动安排阿拉伯语任务,
勤自己提出时才教,保持兴趣驱动。
定位: 通过硬件编程学习 Python/逻辑思维。
现有基础: 臻已有一个树莓派小车项目。
升级方向:
- [ ] 闯关制编程课程:与教学 Agent 结合
- L1:LED 闪烁(print、数字变量)
- L2:小车直走(for 循环、延时)
- L3:小车走正方形(函数、参数)
- L4:避障小车(条件判断、传感器)
- L5:巡线小车(综合逻辑)
- L6:蓝牙遥控(无线通信)
- L7:自主导航(算法)
- [ ] 教学 Agent 教编程:讲概念→写demo→臻自己改→跑上小车看效果
- [ ] 积分打通:学完一个关卡→积分+解锁刷学宝新内容
- [ ] 展示给勤看:臻学会了展示给弟弟,Peer Learning
定位: 讲故事→引出概念→动画演示→理解→应用。
教学法(你设计的五步法):
Step 1: 讲故事 → 情境认知(如阿喀琉斯追乌龟)
Step 2: 引出概念 → 建构主义(引入"无穷小/微分")
Step 3: 动画演示 → 可视化教学(追上的瞬间慢动作)
Step 4: 理解 → 主动学习(Agent追问引导推理)
Step 5: 应用 → 迁移学习(瞬时速度、AI梯度下降)
故事→概念映射表:
数学: | 故事 | 概念 | 应用 | |------|------|------| | 阿喀琉斯追乌龟 | 极限/微分 | 瞬时速度、AI训练 | | 棋盘上的麦粒 | 指数爆炸 | 复利、摩尔定律 | | 高斯1+2+…+100 | 等差数列 | 工程估算 | | 七桥问题 | 图论 | 导航、社交网络 | | 斐波那契的兔子 | 递归/黄金分割 | 算法、自然界 | | 赌博中的数学 | 概率论 | 风险评估 | | 希尔伯特旅馆 | 无穷大 | 计算理论 |
物理: | 故事 | 概念 | 应用 | |------|------|------| | 牛顿的苹果 | 万有引力 | 卫星轨道 | | 伽利略比萨斜塔 | 自由落体/加速度 | 过山车 | | 阿基米德的浴缸 | 浮力 | 船、热气球 | | 爱因斯坦的电梯 | 等效原理 | GPS定位 | | 薛定谔的猫 | 量子叠加 | 量子计算 | | 赫兹的火花实验 | 电磁波 | WiFi、手机 |
化学/生物: | 故事 | 概念 | 应用 | |------|------|------| | 门捷列夫的梦 | 元素周期表 | 新材料 | | 青霉素的偶然 | 微生物/抗生素 | 现代医学 | | 拉瓦锡的天平 | 质量守恒 | 工业生产 |
定位: 训练孩子表达准确、表达方式吸引人。
臻和勤学了那么多知识(英语、古诗、编程、物理),但如果说不出来、说不清楚、说得不吸引人,这些知识就只是死记硬背。表达是输出端——真正掌握一个知识的标准,是能不能把它教给别人。
Agent 展示一张图(比如一只猫在树上)
Agent:"勤,你看看这张图,告诉我发生了什么?"
勤:"猫……树上……"
Agent:"好,那我们一起来说完整。一只____的猫,在____上。"
勤:"一只橘色的猫,在大树上。"
Agent:"太棒了!那它为什么在树上呢?"
→ 训练:完整句子、观察细节、逻辑连贯
Agent讲完阿喀琉斯的故事后:
Agent:"臻,现在你来讲给弟弟听。要让他能听懂哦。"
臻开始复述,Agent 实时反馈:
— "这里说慢一点,弟弟可能没听过乌龟为什么在前面"
— "哇,你用了'越来越小'这个词,比我说得还清楚!"
→ 训练:信息重组、受众意识、语言组织
Agent:"假设你要在班上做一个3分钟的演讲,主题是'为什么天是蓝的'。
先跟我说你的大纲:开头怎么吸引人、中间讲什么、结尾怎么收。"
臻:"我先问大家有没有想过这个问题……然后讲光的散射……最后……"
Agent:"好,现在试着用三句话讲完整个故事。"
→ 训练:结构化思维、概括能力、演讲技巧
Agent:"'他很开心'——臻,你能不能用更生动的词?"
臻:"他眉飞色舞。"
Agent:"勤,到你了。'小猫很开心'。"
勤:"小猫……跳来跳去!"
→ 训练:词汇积累、表达准确度
Agent:"我给你三个词:鲸鱼、雨伞、星期六。编一个短故事。"
臻:"星期六那天,我撑着雨伞去海边,结果遇到一条会说话的鲸鱼……"
→ 训练:想象力、即兴组织能力
表达训练不作为单独项目,而是嵌入到其他模块中:
| 场景 | 表达训练形式 |
|---|---|
| 早读背完诗后 | "用自己的话讲这首诗在说什么" |
| 看完刷学宝视频 | "告诉妈妈这个视频讲了什么" |
| 学完物理故事 | "把阿喀琉斯的故事讲给勤听" |
| 树莓小车做完 | "录一段视频介绍你做了什么" |
| 自由探索 | 孩子问Agent"为什么…"→ Agent反问"你先说说你的想法" |
| 段位 | 要求 | 对应能力 |
|---|---|---|
| 🥚 蛋 | 能用完整句子表达 | 完整性 |
| 🐣 小鸡 | 能把一件事讲清楚(时间/地点/人物/过程) | 条理性 |
| 🐔 公鸡 | 能描述细节、用修饰词 | 生动性 |
| 🦚 孔雀 | 能根据听众调整表达方式 | 适应性 |
| 🦅 鹰 | 能用比喻/类比让复杂概念变简单 | 洞察力 |
🎯 每日任务板
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
📍 今日必做 🔴(不做扣积分、中断连胜)
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
□ 早读:跟Agent读一首诗 臻/勤 各一首
□ 晚读:记忆王者复习昨天内容 臻+勤 各3分钟
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
⭐ 每周挑战 🟡(本周内完成即可)
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
□ 背完一首新诗 臻
□ 学会3个新字母/数字 勤
□ 树莓小车完成一个关卡 臻
□ 给弟弟讲一个科学故事 臻
□ 完整复述一个视频内容 勤
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
🌸 自由探索 🟢(做了加分,不做不扣)
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
□ 刷学宝:看喜欢的视频
□ 问Agent一个"为什么…"
□ 树莓小车自由发挥
└── 新内容:跟着屏幕做动作、模仿秀、音乐节奏
└── 让Agent讲个故事
└── 用手指画字母让摄像头识别
基本规则:
完成每日必做(每项) +10分
保持连胜(连续天数) + 连胜天数×2 分/天
完成周挑战 +50分 + 周徽章
自由探索每15分钟 +5分
准时早读(8点前) +3分
准时晚读(9点前) +3分
连胜中断:
某天必做未完成 → 连胜归零
月度奖励:
全勤30天 → 解锁新功能/新皮肤/新故事
| 维度 | 臻(7-8岁) | 勤(5岁) |
|---|---|---|
| 必做数量 | 2-3个 | 2个 |
| 周挑战 | 背诗、编程、讲故事 | 学新字母、复述视频 |
| 自由项目 | 问为什么、编程、看视频 | 看视频、手指比划、语音跟读 |
| 积分显示 | 数字+段位 | 🏆⭐ 卡通图标 |
| 任务表述 | 文字列表 | 图表+语音提示 |
不靠强迫,靠"好的体验"吸引孩子自己回来。
你之前用的那个跟着屏幕做动作的应用,臻很喜欢——说明好的交互设计本身就有吸引力。我们的策略是:
第一阶段:诱饵(前1-2周)
目标:让孩子觉得「这个系统好玩」
手段:
└── 刷学宝:上来就刷喜欢的视频
└── 互动游戏:跟读给奖励、手指比划放烟花
└── 配音/模仿秀:用麦克风学动物叫、模仿英语发音
└── 不做强制任务,自由探索为主
第二阶段:习惯(2-4周)
目标:让孩子形成「每天来一下」的习惯
手段:
└── 早读晚读固定时间(锚定在已有习惯上)
└── 连胜 Streak 机制(断了会可惜)
└── 每日任务出现,但只设1-2个必做
└── Agent 语气:热情的、陪伴的、不说教
第三阶段:系统(1个月后)
目标:孩子主动完成每日任务
手段:
└── 积分体系成熟
└── 双账号PK让竞争驱动
└── 解锁新内容("你背完这首诗,就能解锁一个新故事")
└── Agent 根据兴趣主动推荐新内容
Agent 检测到抗拒(不回应/消极回应/试图关闭页面):
→ 不强推,切换模式:
"那我们今天不学了,玩个游戏吧?"
"要不要看个视频?"
"臻,你教勤一个英语单词好不好?"
→ 如果完全不想碰 → "好的,那明天见!"
→ 当日必做标记为"跳过",不扣积分,但连胜不涨
关键:不给负面反馈。 今天不学不是失败,是给明天留余地。
目前计划偏重"学习",但不是每天都要学。每周安排:
| 活动 | 形式 | 适合 |
|---|---|---|
| 跟着屏幕做动作 | 摄像头识别姿态→Agent放音乐→孩子跟着做 | 臻(特别喜欢) |
| 画画/涂色 | 用鼠标或触控板画,Agent描述画面 | 勤 |
| 模仿秀 | 用麦克风学动物叫、模仿英语发音 | 勤→臻 |
| 音乐节奏游戏 | Agent打拍子,孩子跟着敲桌子 | 臻+勤 |
| 编故事 | 看图编故事,讲出来Agent记录 | 臻 |
| 自然观察 | 看窗外/阳台植物,描述看到什么 | 臻+勤 |
不是为了让臻和勤成为艺术家,而是: - 跟着动作做→ 臻很喜欢,这是最好的"诱饵" - 模仿秀/音乐 → 5-7岁孩子天然喜欢,不需要意志力 - 编故事/观察 → 练表达,但不像是"在练表达"
现有设备:
Mac mini(你正在用这台)→ 你的主力机:量化交易、开发
Mac mini M1 16GB → 孩子的学习机!
科大讯飞 T20 → 英语跟读评测 + 学校同步课程
学习机配置:
Mac mini M1 16GB
├── 接任意显示器(23-27寸,建议1080P以上)
├── USB麦克风(推荐,¥100-200的就好)
├── 键盘鼠标
├── 外接摄像头(可选,iSight坐姿检测用)
├── 独立 macOS 账户 + 屏幕使用时间管控
└── 开机自动全屏进入「臻&勤学习中心」
为什么选 Mac mini M1 而不是 iMac:
- 已有,零成本
- M1 16GB 跑 Web服务 + 语音识别完全够用
- 两台 Mac mini 物理隔离(你做量化不被打扰)
- 省下 iMac 的¥13,000+
科大讯飞 T20 的定位:
├── 英语跟读评测(讯飞语音技术全国最好)
├── 学校同步课程
└── 管控比macOS更严格,可以作为「限制模式」的补充
坐姿+作业监控:
├── 硬件:USB 摄像头(¥150-300,1080P)
├── 坐姿:MediaPipe 人脸关键点检测
│ ├── 距离 < 40cm → "坐远一点"
│ ├── 低头/歪头 → "头抬起来"
│ └── 走神(视线偏离屏幕>10秒)→ "臻,在看什么呢?"
├── 作业计时:
│ ├── 摄像头检测到人在桌前→开始计时
│ ├── 5分钟没动笔→"可以开始写了"
│ └── 写了30分钟→"休息5分钟"
└── 错题本(需配合拍照上传):
├── 臻做完作业→拍照(手机/T20都可以)
├── Agent OCR识别→自动标注错题
├── 按学科/知识点分类归档
└── 定期从错题本出题→做对3次→移除
| 项目 | 费用 | 说明 |
|---|---|---|
| Mac mini M1 16GB | 已有 | 零成本 |
| 显示器 | ¥1,000-2,000 | 配给孩子用 |
| USB 麦克风 | ¥100-200 | 语音交互 |
| USB 摄像头 | ¥150-300 | 坐姿检测+作业监控 |
| 小音箱 | ¥100-200 | Agent语音输出 |
| 键盘鼠标 | 已有或¥200 | 已有则零成本 |
| 树莓派小车配件 | 已购 | 已有 |
| DeepSeek API | 月均¥30-50 | 持续费用 |
| 科大讯飞 T20 | 已有 | 零成本 |
| 总计一次性投入 | ¥1,350-2,700 | 主要是显示器+配件 |
| 对比买iMac节省 | ¥11,000+ |
不着急全做,先跑通最简单的版本证明能行:
今天能交付的: 教学 Agent 的 system prompt + Web 界面原型代码。