毕业设计与研究

会议纪要智能生成系统的设计与实现

本研究实现了一个端到端的智能会议系统,集成音频处理、说话人分离、语音识别与结构化摘要生成。通过三重微调方案,在消费级硬件上实现了高性能的本地化部署。

11.2% ↓
DER 降幅
14.5% ↓
CER 降幅

核心技术架构

record_voice_over
说话人分离 (Diarization)
基于 Pyannote 3.0,通过领域适配训练优化混淆率。
speech_to_text
语音识别 (ASR)
Whisper-v3 + AdaLoRA 微调,针对中文会议场景深度适配。
auto_awesome
结构化摘要 (LLM)
DeepSeek-R1-8B 指令微调,强制输出 5 类结构化字段。
Meeting App Live
Powered by whjie
avatar whj

会议纪要智能生成系统

语音转换为结构化纪要。

cloud_upload

互联网会议.MP3

00:00
李明 (CEO)
0.0s

大家好。

1.1s

我是李明。

2.4s

今天把大家叫来,是因为情况很紧急。