ElevenLabs API (TTS) 테스트 ! AI 숏츠 프로젝트 일일 요약 (3)

A_V

Solo.dev 2025. 5. 31. 00:09

오늘 진행 상황 요약

1. ElevenLabs TTS 기능 구현 및 테스트 완료

core/text_to_speech.py:
- ElevenLabs API를 사용하여 텍스트를 음성으로 변환.
- 생성된 오디오 파일의 경로와 길이를 반환하는 기능 구현.
- .env 파일을 통해 API 키를 안전하게 관리.
- configs/voice_config.json 파일에서 사용할 목소리 ID를 불러옴.
- soundfile 라이브러리를 사용하여 생성된 오디오 파일의 길이를 정확히 측정.
tests/test_text_to_speech.py:
- TTS 기능에 대한 단위 테스트 작성 및 성공적으로 통과 확인.
- voice_config.json에서 목소리 ID를 가져와 테스트.
- 생성된 오디오 파일의 길이 확인.
configs/voice_config.json:
- TTS에 사용할 목소리 ID와 관련 정보를 JSON 형식으로 저장 및 관리.

세부 작업:

requirements.txt:

# openai-whisper 패키지 주석 처리
# openai-whisper==2023.x.x

core/speech_to_text.py:

# speech_to_text.py
# ASR 기능은 현재 미사용
# def transcribe_audio(audio_path):
#     # OpenAI Whisper 관련 코드 (주석 처리됨)
#     pass

Solo.dev

혼자 개발하는 여정을 적는 블로그입니다. 쉽지 않네요

1인앱개발, OCR, 앱개발, 앱 개발, React-native, firebase, python, expo, IAP, WebSocket, IOS, rn, ReactNative, 앱, Flask, React Native, datep, AI, Android, 배포,