html5怎么插入语音_HTML5语音识别API与音频录制实现

2025-10-22 8:08

|

4

|

web前端

589 字

|

3 分钟

使用<audio>标签可插入语音播放，支持多格式兼容；2. Web Speech API实现语音识别，需https环境且推荐chrome；3. MediaRecorder API用于音频录制，通过麦克风捕获并保存为Blob；4. 可整合二者功能，同步录音与转文本，注意权限与兼容性处理。

html5怎么插入语音_HTML5语音识别API与音频录制实现

要在html5中插入语音播放和实现语音识别与音频录制，需要分别使用<audio>标签、Web Speech API 和 MediaRecorder API。下面分步说明如何实现这些功能。

1. 插入语音播放（使用 <audio> 标签）

html5 提供了 <audio> 标签，用于在网页中嵌入音频文件，支持多种格式如 MP3、WAV、OGG。

示例代码：

<audio controls>   <source src="example.mp3" type="audio/mpeg">   <source src="example.wav" type="audio/wav">   您的浏览器不支持 audio 标签。 </audio>

说明：

controls 属性显示播放、暂停、音量等控件。
提供多个 <source> 可提高浏览器兼容性。

2. 实现语音识别（Web Speech API）

HTML5 的 Web Speech API 支持语音识别，可将用户的语音转换为文本。目前主要在 Chrome 浏览器中支持较好。

立即学习“前端免费学习笔记（深入）”；

示例代码：

<button id="startBtn">开始录音</button> <p id="result">识别结果将显示在这里</p>  <script> const startBtn = document.getElementById('startBtn'); const result = document.getElementById('result');  // 检查浏览器是否支持 SpeechRecognition const SpeechRecognition = window.SpeechRecognition || window.webkitSpeechRecognition; if (!SpeechRecognition) {   result.textContent = '您的浏览器不支持语音识别，请使用 Chrome 浏览器。'; } else {   const recognition = new SpeechRecognition();   recognition.lang = 'zh-CN'; // 设置中文识别   recognition.interimResults = false;    startBtn.addEventListener('click', () => {     result.textContent = '正在聆听…';     recognition.start();   });    recognition.addEventListener('result', (e) => {     const transcript = e.results[0][0].transcript;     result.textContent = '识别结果：' + transcript;   });    recognition.addEventListener('error', () => {     result.textContent = '识别失败，请重试。';   }); } </script>

注意： 网站必须通过 HTTPS 协议运行，否则语音识别可能无法工作。

灵机语音

56

查看详情

3. 实现音频录制（MediaRecorder API）

使用 MediaRecorder API 可以录制用户麦克风输入的音频，并保存为 Blob 文件（如 WAV 或 MP3）。

示例代码：

<button id="recordBtn">开始录制</button> <button id="stopBtn" disabled>停止录制</button> <audio id="playback" controls style="display:none;"></audio>  <script> let mediaRecorder; let audioChunks = []; const recordBtn = document.getElementById('recordBtn'); const stopBtn = document.getElementById('stopBtn'); const playback = document.getElementById('playback');  recordBtn.addEventListener('click', async () => {   const stream = await navigator.mediaDevices.getUserMedia({ audio: true });   mediaRecorder = new MediaRecorder(stream);    mediaRecorder.start();   recordBtn.disabled = true;   stopBtn.disabled = false;    mediaRecorder.addEventListener('dataavailable', event => {     audioChunks.push(event.data);   });    mediaRecorder.addEventListener('stop', () => {     const audioBlob = new Blob(audioChunks, { type: 'audio/wav' });     const audioUrl = URL.createObjectURL(audioBlob);     playback.src = audioUrl;     playback.style.display = 'block';     audioChunks = []; // 清空缓存      // 可选：上传到服务器     // const formData = new FormData();     // formData.append('audio', audioBlob, 'recording.wav');   }); });  stopBtn.addEventListener('click', () => {   mediaRecorder.stop();   recordBtn.disabled = false;   stopBtn.disabled = true;    // 停止所有音轨以关闭麦克风   mediaRecorder.stream.getTracks().forEach(track => track.stop()); }); </script>

说明：

navigator.mediaDevices.getUserMedia() 请求麦克风权限。
MediaRecorder 将音频流分段保存为 Blob。
最终生成可播放的音频 URL。

4. 完整功能整合建议

你可以将语音识别与音频录制结合使用：

用 MediaRecorder 录制原始音频用于保存或上传。
同时使用 SpeechRecognition 实时转文字，提升交互体验。
注意处理用户权限请求（麦克风访问）和浏览器兼容性问题。

基本上就这些。实现语音功能时，关键是确保协议安全（HTTPS）、处理好用户交互和错误反馈。不复杂但容易忽略细节。

以上就是

ai app chrome html html5 https stream win 浏览器

text=ZqhQzanResources

1. 插入语音播放（使用 <audio> 标签）

2. 实现语音识别（Web Speech API）

3. 实现音频录制（MediaRecorder API）

4. 完整功能整合建议

推荐文章