paper-analysis-assistant

Solid

根据arXiv论文网址自动下载PDF并进行多维度分析,包括文本提取、词频分析、语音播报、播客对话生成、交互式网页、PPT、总结图和引用分析

AI & Automation 1,525 stars 170 forks Updated today

Install

View on GitHub

Quality Score: 86/100

Stars 20%
100
Recency 20%
100
Frontmatter 20%
70
Documentation 15%
100
Issue Health 10%
50
License 10%
0
Description 5%
100

Skill Content

# 论文分析助手 ## 任务目标 - 本 Skill 用于:根据 arXiv 论文网址自动进行多维度分析并生成多种格式的输出 - 能力包含:PDF 下载与文本提取、词频统计、语音合成、播客对话生成、交互式网页、PPT 生成、总结图生成、引用分析 - 触发条件:用户提供 arXiv 论文网址或论文 PDF 文件 ## 前置准备 - 依赖说明:所需 Python 包已在 dependency 中列出 - 停用词资源:需准备英文停用词列表,用于词频分析过滤 ## 操作步骤 - 标准流程: 1. **下载 PDF 文件** - 调用 `scripts/download_pdf.py` 下载 arXiv PDF - 参数:`--url` (arXiv 论文网址), `--output` (输出 PDF 文件路径) 2. **提取 PDF 文本** - 调用 `scripts/extract_text.py` 提取纯文本 - 参数:`--pdf` (PDF 文件路径), `--output` (输出 txt 文件路径) 3. **词频分析** - 调用 `scripts/analyze_word_frequency.py` 进行词频统计 - 参数:`--txt` (txt 文件路径), `--output` (输出 csv 文件路径) - 该脚本会自动过滤英文停用词(见 references/stopwords.txt) 4. **文本转语音** - 调用 `scripts/text_to_speech.py` 将文本转为语音 - 参数:`--txt` (txt 文件路径), `--output` (输出 wav 文件路径) 5. **生成播客对话** - **智能体步骤**:根据论文内容生成双人对话脚本(包含两个角色的对话内容) - **脚本步骤**:调用 `scripts/dialogue_to_podcast.py` 将对话脚本转换为语音 - 参数:`--dialogue` (对话脚本文件路径), `--output` (输出 wav 文件路径) 6. **生成交互式网页** - 调用 `scripts/generate_html.py` 生成交互式网页 - 参数:`--txt` (txt 文件路径), `--word_freq` (词频 csv 文件路径), `--output` (输出 html 文件路径) 7. **生成 PPT** - 调用 `scripts/generate_ppt.py` 生成演示文稿 - 参数:`--txt` (txt 文件路径), `--output` (输出 pptx 文件路径) 8. **生成总结图** - **智能体步骤**:根据论文内容直接生成"一图胜千言"的总结图(PNG 格式) 9. **分析引用链接** - 调用 `scripts/extract_references.py` 提取引用链接 - 参数:`--txt` (txt 文件路径), `--output` (输出 csv 文件路径) - 可选分支: - 当 用户直接提供 PDF 文件:跳过步骤 1,直接从步骤 2 开始 - 当 用户只需要部分分析:根据需求选择性执行对应步骤 ## 资源索引 - 下载脚本:见 [s...

Details

Author
anbeime
Repository
anbeime/skill
Created
4 months ago
Last Updated
today
Language
Python
License
None

Similar Skills

Semantically similar based on skill content — not just same category

AI & Automation Listed

paper-conductor

论文全流程集大成助手(Academic paper all-in-one assistant and conductor)。覆盖学术论文从选题到投稿 的 8 个阶段(选题质询 → 文献调研 → 写作 → 制图 → 润色去AI味 → 审稿 → 答辩 → 投稿)。它自己就能动手: 写作(引言/方法/讨论/全文草稿)、润色与表达改写、基础审稿与自查、规划全程路线图,都直接做。 当某个环节有更强的专门 skill 时(深度系统性文献调研、框架图、中文破折号 hard gate 级去AI味、 学校 DOCX 模板交付、本地 .bib 检索、多 reviewer 深度评审),它会推荐并把产物交接过去。既动手又动嘴。 中文触发:写论文、帮我写引言/方法/讨论、润色这段、读起来像 AI、论文全流程、从头到尾写论文、 下一步该做什么、论文路线图、论文总调度、把这些阶段串起来。 English triggers: write my paper, draft a section, polish this, sounds too much like AI, end-to-end paper help, what should I do next on my paper, paper roadmap, orchestrate the writing process. 当任务单一明确且某个专门 skill 明显更合适时,可直接用那个专门 skill;paper-conductor 适合全流程、 多阶段、不确定从何下手的场景,并能自己兜底完成写作与润色。

2 Updated 1 weeks ago
jiayou20021120-afk
AI & Automation Listed

ai-article

自动图文助手适合内容创作者、运营、technical、内容媒体在用户提出“自动公众号和种草”这类问题,需要快速拆解目标、判断重点并形成可执行结果时使用,帮助基于输入材料生成摘要、诊断结论、行动建议和可复用交付物。

34 Updated 6 days ago
allinherog-star
Data & Documents Solid

light-file-reading

强大地读文件并学习——Word、PDF、PPTX、Excel、CSV、图片、视频、代码、压缩包等。当用户提供任何文件、问"这个文件讲了什么"、或任务需要理解已有材料时使用(常驻,自动触发)。不只提取文字,而是理解结构、逻辑、图表、数据、实验结果、格式要求、章节关系、视觉风格、隐含要求与可复用内容,并转化为可执行任务。

77 Updated today
Light0305