reddit-intellisted

Scrape Reddit posts by keyword, classify intent and sentiment by industry, translate to Chinese, and export a bilingual Excel intelligence report. Trigger when user says: scrape reddit, reddit analysis, reddit insights, monitor reddit, 爬reddit, reddit舆情, reddit帖子分析, 分析reddit, reddit监控, 帮我看看reddit上, reddit上有什么人说
chinesemustardcoloration738/reddit-intel · ★ 0 · Data & Documents · score 65

Install: claude install-skill chinesemustardcoloration738/reddit-intel

# reddit-intel ## Reddit 舆情情报 Skill --- ## ⚠️ Reddit API 限制说明（永久生效，必须在 Phase 1 告知用户） **这是 Reddit 的平台政策，不是工具的 bug。** ``` Reddit 官方 API 限制（2023年收紧后）： ① 单次请求：最多返回 100 条帖子 ② 搜索总量：同一关键词+排序，分页后约 250-500 条上限（Reddit 故意截断，防止大规模数据抓取） ③ 评论获取：需要对每条帖子单独发请求（不含在搜索结果里） ④ 限流：请求过快会被封 IP，需每次间隔 2 秒我们的策略（4种排序 × 多个版块 × 去重）： → 可将单关键词可获取量扩展至 600-1500 条 → 指定日期范围 = 按周分段请求，不突破单次上限，但总量可叠加注意：Reddit 有数百万条相关帖子，API 只给你很小的窗口。这是平台限制，无法绕过。PullPush.io（第三方历史数据）可选接入，但该服务不稳定，随时可能关闭，不作为默认方案。 ``` --- ## 永久约束（任何阶段均有效） ``` ① 禁止捏造数据。字段无法判断时，用兜底规则（见 CLASSIFY_RULES.md），不允许输出"无法判断"作为最终结果。 ② 批处理强制执行。Phase 3 每批严格处理 10 条，禁止一次性处理全部。 ③ 竞品只提取明确出现的品牌名。帖子原文没有的，一律不写。 ④ 置信度诚实标注。文本不足以可靠判断时，强制标"低"。 ⑤ 行动点必须具体，"值得关注""建议持续观察"直接删除重写。 ⑥ 热评精华基于真实评论内容，无内容时留空。 ⑦ 概览 Tab（Sheet 2）的统计数字由 Python 计算，不允许 Claude 估算。 ``` --- ## 架构说明 ``` 文件加载时序： Phase 1：READ ${CLAUDE_SKILL_DIR}/SUBREDDIT_MAP.md（行业版块推荐） Phase 3：READ ${CLAUDE_SKILL_DIR}/CLASSIFY_RULES.md READ ${CLAUDE_SKILL_DIR}/TRANSLATE_RULES.md Phase 4：READ ${CLAUDE_SKILL_DIR}/OUTPUT_SCHEMA.md ``` --- ## Phase 1：参数确认 **加载：** ``` READ "${CLAUDE_SKILL_DIR}/SUBREDDIT_MAP.md" ``` 向用户一次性问清以下参数： ``` ① 关键词是什么？支持逻辑运算： - AND："Binance AND scam"（同时含两个词） - OR： "ChatGPT, Claude, Gemini"（逗号��隔 = OR） - NOT："cryptocurrency NOT Bitcoin"（排除词） ② 分析目的是什么？ A. 品牌/产品研究（关键词是产品或公司名，如：Notion / Binance / ChatGPT） → 使用产品研究框架（P1-P5） B. 行业舆情监控（关键词是行业词或话题词，如：加密货币 / AI写作 / 电商退款） → 自动匹配行业框架，Claude 根据关键词推断 C. 自定义分类 → 追问