← ClaudeAtlas

reddit-intellisted

Scrape Reddit posts by keyword, classify intent and sentiment by industry, translate to Chinese, and export a bilingual Excel intelligence report. Trigger when user says: scrape reddit, reddit analysis, reddit insights, monitor reddit, 爬reddit, reddit舆情, reddit帖子分析, 分析reddit, reddit监控, 帮我看看reddit上, reddit上有什么人说
chinesemustardcoloration738/reddit-intel · ★ 0 · Data & Documents · score 65
Install: claude install-skill chinesemustardcoloration738/reddit-intel
# reddit-intel ## Reddit 舆情情报 Skill --- ## ⚠️ Reddit API 限制说明(永久生效,必须在 Phase 1 告知用户) **这是 Reddit 的平台政策,不是工具的 bug。** ``` Reddit 官方 API 限制(2023年收紧后): ① 单次请求:最多返回 100 条帖子 ② 搜索总量:同一关键词+排序,分页后约 250-500 条上限 (Reddit 故意截断,防止大规模数据抓取) ③ 评论获取:需要对每条帖子单独发请求(不含在搜索结果里) ④ 限流:请求过快会被封 IP,需每次间隔 2 秒 我们的策略(4种排序 × 多个版块 × 去重): → 可将单关键词可获取量扩展至 600-1500 条 → 指定日期范围 = 按周分段请求,不突破单次上限,但总量可叠加 注意:Reddit 有数百万条相关帖子,API 只给你很小的窗口。 这是平台限制,无法绕过。PullPush.io(第三方历史数据)可选接入, 但该服务不稳定,随时可能关闭,不作为默认方案。 ``` --- ## 永久约束(任何阶段均有效) ``` ① 禁止捏造数据。字段无法判断时,用兜底规则(见 CLASSIFY_RULES.md), 不允许输出"无法判断"作为最终结果。 ② 批处理强制执行。Phase 3 每批严格处理 10 条,禁止一次性处理全部。 ③ 竞品只提取明确出现的品牌名。帖子原文没有的,一律不写。 ④ 置信度诚实标注。文本不足以可靠判断时,强制标"低"。 ⑤ 行动点必须具体,"值得关注""建议持续观察"直接删除重写。 ⑥ 热评精华基于真实评论内容,无内容时留空。 ⑦ 概览 Tab(Sheet 2)的统计数字由 Python 计算,不允许 Claude 估算。 ``` --- ## 架构说明 ``` 文件加载时序: Phase 1:READ ${CLAUDE_SKILL_DIR}/SUBREDDIT_MAP.md(行业版块推荐) Phase 3:READ ${CLAUDE_SKILL_DIR}/CLASSIFY_RULES.md READ ${CLAUDE_SKILL_DIR}/TRANSLATE_RULES.md Phase 4:READ ${CLAUDE_SKILL_DIR}/OUTPUT_SCHEMA.md ``` --- ## Phase 1:参数确认 **加载:** ``` READ "${CLAUDE_SKILL_DIR}/SUBREDDIT_MAP.md" ``` 向用户一次性问清以下参数: ``` ① 关键词是什么? 支持逻辑运算: - AND:"Binance AND scam"(同时含两个词) - OR: "ChatGPT, Claude, Gemini"(逗号��隔 = OR) - NOT:"cryptocurrency NOT Bitcoin"(排除词) ② 分析目的是什么? A. 品牌/产品研究 (关键词是产品或公司名,如:Notion / Binance / ChatGPT) → 使用产品研究框架(P1-P5) B. 行业舆情监控 (关键词是行业词或话题词,如:加密货币 / AI写作 / 电商退款) → 自动匹配行业框架,Claude 根据关键词推断 C. 自定义分类 → 追问