定位中...

JJYB_AI 智剪 – 智能视频自动剪辑与AI解说工具(离线TTS、原创解说、混剪、AI配音)

头像
一念 2025-12-30 16:38 已编辑
闲聊灌水 46 浏览 0 回复

JJYB_AI智剪 v2.0 是一个功能完整、配置丰富、文档齐全的专业AI视频编辑工具:

  • 🚀 一键启动:智能检查,自动配置
  • 🤖 19个AI模型:全面支持主流模型
  • ⚙️ 143个配置项:专业级精细调优
  • 📚 16个技术文档:完整技术体系
  • 🎯 100%完成度:所有功能完整实现

让AI视频创作更简单、更专业! 🎬✨🚀

⭐ 三大核心功能

🎬 视频编辑器

  • 🎯 完整播放控制 + 轨道管理
  • 音画/字画/字音三重同步 (<100ms)
  • ✨ 特效、滤镜、转场完整支持
  • 📍 URL: http://localhost:5000/

🎙️ AI配音

  • 🔊 多引擎TTS (Edge-TTS/gTTS/voice_clone)
  • 🎵 丰富音色库 + 声音克隆
  • 🎛️ 实时参数调节
  • 📍 URL: http://localhost:5000/voiceover

📝 原创解说

  • 🤖 AI视觉理解 → LLM文案 → TTS配音 → 视频合成
  • 🔗 完整自动化流程
  • 🎯 精确同步机制
  • 📍 URL: http://localhost:5000/commentary

🤖 AI模型支持

大语言模型(9种)

  • 通义千问 (阿里巴巴) – 推荐
  • 文心一言 (百度)
  • ChatGLM (智谱AI)
  • DeepSeek – 性价比高
  • OpenAI GPT-4/GPT-3.5 – 专业版
  • Claude 3 (Anthropic) – 高级推理
  • Google Gemini – 多模态
  • 月之暗面 Kimi – 长文本
  • 讯飞星火 (科大讯飞)

视觉分析模型(6种)

  • 通义千问VL – 推荐
  • 百度视觉
  • 腾讯云视觉
  • GPT-4V (OpenAI Vision)
  • Gemini Vision (Google)
  • Claude Vision (Anthropic)

语音TTS模型(4种)

  • Edge-TTS – 免费推荐(23+音色)
  • Google TTS (gTTS) – 免费多语言
  • Azure TTS – 专业级(付费)
  • Voice Clone – 本地语音克隆

ℹ️ 内置回退:已集成 pyttsx3(离线),在网络受限时会自动回退以保证配音可用。

📖 详细使用说明

第一步:配置API(首次使用必须)

访问API配置页面:http://localhost:5000/api_settings

必须配置(至少一个)

  1. 大语言模型API

    (用于AI文案生成)

    • 推荐:通义千问(免费额度)
    • 性价比:DeepSeek
    • 专业版:OpenAI GPT-4、Claude 3

可选配置: 2. 视觉分析模型API(用于视频内容理解)

  • 推荐:通义千问VL
  1. TTS语音服务

    (已内置Edge-TTS免费服务)

    • 专业级:Azure TTS(需付费)
    • 本地克隆:Voice Clone

第二步:选择功能模块

🎙️ 原创解说剪辑

完整流程

  1. 上传视频文件
  2. 选择大语言模型(自动生成文案)
  3. 选择视觉模型(分析画面内容)
  4. AI自动生成解说文案
  5. 选择音色并配音
  6. 调整参数(可选):
    • 多模态特征提取(6个参数)
    • 时间轴优化(4个参数)
    • 技术性能优化(4个参数)
    • 跨平台适配(6个参数)
  7. 一键导出成品视频

高级配置:52个配置项可精细调优

✂️ 混剪模式

两种模式

  1. 大众混剪模式
    • 批量导入视频素材
    • AI智能识别精彩片段
    • 选择混剪风格(燃向/治愈/搞笑等)
    • 自动添加转场和特效
    • 导出混剪视频
  2. 音乐卡点混剪
    • 上传音乐文件
    • 自动节奏检测(4种算法)
    • 卡点匹配策略(4种)
    • 智能片段选择与排序
    • 自动对齐音乐节拍

高级配置:34个配置项

🔊 AI配音

使用流程

  1. 输入文本内容
  2. 选择TTS引擎:
    • Edge-TTS(推荐,免费,23+音色)
    • Google TTS(免费,100+语言)
    • Azure TTS(专业级,需付费)
    • Voice Clone(本地语音克隆)
  3. 选择音色和语言
  4. 调整基础参数(语速/音调/音量)
  5. 高级配置(可选):
    • TTS声学模型(5种)
    • 声码器配置(5种)
    • 韵律预测(8个参数)
    • 情感TTS(12个参数)
    • 说话人嵌入(8个参数)
    • 音频特征提取(8个参数)
  6. 实时预览效果
  7. 导出高质量音频

高级配置:38个配置项(30个AI配置)

⚠️ 常见问题

问题1:启动失败 – Python未安装

症状:提示”未找到Python”

解决方案

  1. 访问:https://www.python.org/downloads/
  2. 下载Python 3.9-3.11版本
  3. 安装时勾选”Add Python to PATH”
  4. 重新运行启动文件

问题2:端口被占用

症状:提示”端口5000已被占用”

解决方案

  1. 启动时选择[Y]自动释放端口
  2. 或手动关闭占用进程:netstat -ano | findstr “:5000” taskkill /F /PID [进程ID]

问题3:依赖包缺失

症状:启动失败,提示模块未找到

解决方案

  1. 运行”安装AI依赖.bat”完整安装
  2. 或启动时选择[1]快速安装
  3. 手动安装:pip install -r requirements.txt -i https://mirrors.aliyun.com/pypi/simple/

问题4:AI功能无法使用

症状:无法生成文案/无法配音

解决方案

  1. 检查API配置:访问 http://localhost:5000/api_settings
  2. 确保至少配置了一个大语言模型API
  3. 点击”测试”按钮验证API是否有效
  4. 查看API密钥是否正确

问题5:启动后无法访问

症状:浏览器打开但无法加载页面

解决方案

  1. 检查防火墙设置
  2. 确认端口5000未被其他程序占用
  3. 尝试手动访问:http://127.0.0.1:5000
  4. 查看启动窗口的错误信息

项目地址

不过需要注意,看项目issue提示,作者给的文件,还是自己的电脑配置包,更多好需要自行研究

https://github.com/jianjieyiban/JJYB_AI_VideoAutoCut

回复 (0)

发表回复

论坛 分类 功能 我的