关于 redpaper
把每日人形机器人 / 通用具身 AI 论文做成「小红书 feed」的小项目。每天定时抓 arXiv 等源、用 LLM 翻译标题与摘要、渲染 PDF 首页,最后用瀑布流呈现。
数据源
- arXiv:通过官方 API 按分类拉取(Phase 1 已接入)
- Hugging Face Daily Papers:用作热度排序(Phase 2)
- Semantic Scholar:补充引用数与相关论文(Phase 2)
- 量子位 / 机器之心 / 新智元:作为中文报道挂在对应论文下(Phase 2)
- AlphaXiv:相关讨论(Phase 2)
- 小红书:手动维护链接(Phase 3,可选)
本地交互(所有访客都适用)
收藏、自定义分类、已读、暗色模式都只存在你这台浏览器的
localStorage。哪怕这个站是 public 的,你在 A 浏览器收藏的论文
不会跟 B 用户的收藏夹合并,也不会回流到我的仓库 — 后端就是几份静态 JSON,
没有任何接收用户写入的接口。
这也意味着:换设备 / 清缓存 = 你的收藏夹清零。如果想长期保留,建议给浏览器 做同步,或在每篇详情页把 BibTeX 复制下来。
谁能改「频道标签」?
频道(首页那一排「全部 / 大模型 / 视觉…」)来自仓库里的
config/channels.yaml,只有有 push 权限的人能改。也就是说:
- 部署者(拥有这个 GitHub 仓库的人):改 yaml 提交后,CI 重新抓取并发布
- 访客:可以筛选 / 搜索 / 本地收藏,但不能新增频道标签
所以如果你看到的标签不符合你的口味,最干净的做法是:fork 一份这个仓库,
改你自己的 channels.yaml,部署到 你的名字.github.io/redpaper,
就有一个完全个性化的「我的 AI 论文小红书」。
怎么改配置(部署者)
仓库里改 config/channels.yaml 调整频道与关键词,
config/sources.yaml 启停数据源,
config/site.yaml 改站点元信息和 LLM 后端。
CI 每天 UTC 0 点(北京 8 点)自动跑一次,你也可以从 Actions 页手动触发。
致谢
arXiv 提供开放的论文 API;Noto Serif SC 提供漂亮的中文衬线字体;以及所有写论文的研究者。
