누구나 활용할 수 있는 음성 인식용 데이타, 커먼 보이스

dev | 2018-07-15

요즘 머신 러닝이나 딥러닝이 화두다. 이제 머신 러닝 안하면 시대에 뒤쳐지는 느낌까지 든다. 머신 러닝을 하려면 학습을 시킬 데이터가 있어야 하는데 음성 인식 분야는 아무래도 돈있는 기업과 개인의 격차가 심하다. 개인은 음성 인식을 시작할 수 있는 데이터 셋을 구하기 거의 힘든 것으로 보인다. 이런 격차를 없애기 위해서 모질라에서 커먼 보이스(Common Voice)라는 프로젝트를 시작했다.

음성과 연관된 내 프로필 정보와 함께 화면의 문장을 읽어주기만 하면 이것이 데이터로 쌓이고 이 데이터를 필요로 하는 사람들이 자유롭게 활용할 수 있게 다리를 놓아주는 프로젝트이다. 처음에 프로젝트가 런칭됐을 때에는 무슨 프로젝트인지 정확히 잘 몰랐는데 지역화 작업을 하다보니 참으로 의미 있는 프로젝트고 역시 모질라가 있기에 가능한 프로젝트라는 생각이 든다.

프로젝트가 시작된지는 꽤 됐는데 지역화 작업은 그동안 신경을 거의 못쓰고 있었다. 요즘은 파이어폭스 류의 주요 제품 지역화 작업만하고 나머지 프로젝트는 다른 분들의 자발적인 참여에 의존하고 있다. 그런데 무슨 계기였는지 갑자가 수백개의 커먼 보이스 스트링이 다 번역되어서 올라왔다. 참여해주신 분들께 감사하다. 한꺼번에 올라와서 리뷰하는데 좀 힘들긴 했지만 성공적으로 한국어 사이트가 런칭되었다. 아직 어색한 표현들도 많이 보이는데 변경할 좋은 번역을 추천하고 싶은 사람들은 폰툰 사이트에서 변역을 추가할 수 있다.

무료로 다운 받을 수 있는 음성 데이터가 12기가다. 어마어마한 양이다. 부디 프로젝트가 잘 되어서 많은 사람들이 유용하게 활용할 수 있으면 좋겠다.

누구나 활용할 수 있는 음성 인식용 데이타, 커먼 보이스

Comments

Post a comment