Find the speech data you need

Gujarati Language Training Dataset - 500H Spontaneous Pair Conversational Audio and Video

Gujarati · India

500 hours of Gujarati spontaneous conversations with metadata and transcripts.

Norwegian Language Training Dataset - 500H Spontaneous Pair Conversational Audio and Video

Norwegian · Norway

500 hours of Norwegian spontaneous conversations with metadata and transcripts.

1,000 hrs/moMonthly capacity100Speakers$95/hrFrom

Dutch (Western) Language Training Dataset - 1000H Spontaneous Pair Conversational Audio and Video

Dutch (Western) · Netherlands

1000 hours of Dutch (Western) spontaneous conversations with metadata and transcripts.

1,500 hrs/moMonthly capacity150Speakers$70/hrFrom

Mandarin Chinese Language Training Dataset - 1500H Spontaneous Pair Conversational Audio and Video

Mandarin Chinese · Taiwan

1500 hours of Mandarin Chinese spontaneous conversations with metadata and transcripts.

Marathi Language Training Dataset - 500H Spontaneous Pair Conversational Audio and Video

Marathi · India

500 hours of Marathi spontaneous conversations with metadata and transcripts.

Indonesian Language Training Dataset - 2000H Spontaneous Pair Conversational Audio and Video

Indonesian · Indonesia

2000 hours of Indonesian spontaneous conversations with metadata and transcripts.

Malayalam Language Training Dataset - 500H Spontaneous Pair Conversational Audio and Video

Malayalam · India

500 hours of Malayalam spontaneous conversations with metadata and transcripts.

Romanian Language Training Dataset - 1000H Spontaneous Pair Conversational Audio and Video

Romanian · Romania

1000 hours of Romanian spontaneous conversations with metadata and transcripts.

1,000 hrs/moMonthly capacity100Speakers$90/hrFrom

Slovak Language Training Dataset - 1000H Spontaneous Pair Conversational Audio and Video

Slovak · Slovakia

1000 hours of Slovak spontaneous conversations with metadata and transcripts.

1,500 hrs/moMonthly capacity150Speakers$90/hrFrom

English (Western) Language Training Dataset - 1500H Spontaneous Pair Conversational Audio and Video

English (Western) · United States

1500 hours of English (Western) spontaneous conversations with metadata and transcripts.

1,000 hrs/moMonthly capacity100Speakers$65/hrFrom

Urdu Language Training Dataset - 1000H Spontaneous Pair Conversational Audio and Video

Urdu · Pakistan

1000 hours of Urdu spontaneous conversations with metadata and transcripts.

2,000 hrs/moMonthly capacity200Speakers$60/hrFrom

English (African) Language Training Dataset - 1000H Spontaneous Pair Conversation

English (African) · South Africa

2000 hours of English (African) spontaneous conversations with metadata and transcripts.

2,000 hrs/moMonthly capacity200Speakers$60/hrFrom

English (Asian) Language Training Dataset - 2000H Spontaneous Pair Conversational Audio and Video

English (Asian) · Singapore

2000 hours of English (Asian) spontaneous conversations with metadata and transcripts.

Persian (Farsi) Language Training Dataset - 500H Spontaneous Pair Conversational Audio and Video

Persian (Farsi) · Iran

500 hours of Persian (Farsi) spontaneous conversations with metadata and transcripts.

Finnish Language Training Dataset - 500H Spontaneous Pair Conversational Audio and Video

Finnish · Finland

500 hours of Finnish spontaneous conversations with metadata and transcripts.

Portuguese (African) Language Training Dataset - 500H Spontaneous Pair Conversational Audio and Video

Portuguese (African) · Angola

500 hours of Portuguese (African) spontaneous conversations with metadata and transcripts.

1,000 hrs/moMonthly capacity50Speakers$95/hrFrom

German Language Training Dataset - 1000H Spontaneous Pair Conversational Audio and Video

German · Germany

1000 hours of German spontaneous conversations with metadata and transcripts.

Kannada Language Training Dataset - 500H Spontaneous Pair Conversational Audio and Video

Kannada · India

500 hours of Kannada spontaneous conversations with metadata and transcripts.

1,500 hrs/moMonthly capacity150Speakers$75/hrFrom

Croatian Language Training Dataset - 1500H Spontaneous Pair Conversational Audio and Video

Croatian · Croatia

1500 hours of Croatian spontaneous conversations with metadata and transcripts.

Greek Language Training Dataset - 1000H Spontaneous Pair Conversational Audio and Video

Greek · Greece

1000 hours of Greek spontaneous conversations with metadata and transcripts.

1,000 hrs/moMonthly capacity100Speakers$90/hrFrom

Hungarian Language Training Dataset - 1000H Spontaneous Pair Conversational Audio and Video

Hungarian · Hungary

1000 hours of Hungarian spontaneous conversations with metadata and transcripts.

Hindi Language Training Dataset - 2000H Spontaneous Pair Conversational Audio and Video

Hindi · India

2000 hours of Hindi spontaneous conversations with metadata and transcripts.

1,000 hrs/moMonthly capacity100Speakers$65/hrFrom

Dutch (LatAm) Language Training Dataset - 1000H Spontaneous Pair Conversational Audio and Video

Dutch (LatAm) · Suriname

1000 hours of Dutch (LatAm) spontaneous conversations with metadata and transcripts.

2,000 hrs/moMonthly capacity200Speakers$75/hrFrom

Thai Language Training Dataset - 2000H Spontaneous Pair Conversational Audio and Video

Thai · Thailand

2000 hours of Thai spontaneous conversations with metadata and transcripts.

Russian Language Training Dataset - 1000H Spontaneous Pair Conversational Audio and Video

Russian · Russia

1000 hours of Russian spontaneous conversations with metadata and transcripts.

2,000 hrs/moMonthly capacity200Speakers$75/hrFrom

Turkish Language Training Dataset - 2000H Spontaneous Pair Conversational Audio and Video

Turkish · Turkey

2000 hours of Turkish spontaneous conversations with metadata and transcripts.

Malay Language Training Dataset - 2000H Spontaneous Pair Conversational Audio and Video

Malay · Malaysia

2000 hours of Malay spontaneous conversations with metadata and transcripts.

Spanish (Western) Language Training Dataset - 1000H Spontaneous Pair Conversational Audio and Video

Spanish (Western) · Spain

1000 hours of Spanish (Western) spontaneous conversations with metadata and transcripts.

Portuguese (Western) Language Training Dataset - 1000H Spontaneous Pair Conversational Audio and Video

Portuguese (Western) · Portugal

1000 hours of Portuguese (Western) spontaneous conversations with metadata and transcripts.

Portuguese (LatAm) Language Training Dataset - 2000H Spontaneous Pair Conversational Audio and Video

Portuguese (LatAm) · Brazil

2000 hours of Portuguese (LatAm) spontaneous conversations with metadata and transcripts.

Spanish (LatAm) Language Training Dataset - 2000H Spontaneous Pair Conversational Audio and Video

Spanish (LatAm) · Mexico

2000 hours of Spanish (LatAm) spontaneous conversations with metadata and transcripts.

Hausa Language Training Dataset - 2000H Spontaneous Pair Conversational Audio and Video

Hausa · Nigeria

2000 hours of Hausa spontaneous conversations with metadata and transcripts.

1,500 hrs/moMonthly capacity150Speakers$85/hrFrom

Ukrainian Language Training Dataset - 1500H Spontaneous Pair Conversational Audio and Video

Ukrainian · Ukraine

1500 hours of Ukrainian spontaneous conversations with metadata and transcripts.

Swedish Language Training Dataset - 500H Spontaneous Pair Conversational Audio and Video

Swedish · Sweden

500 hours of Swedish spontaneous conversations with metadata and transcripts.

1,000 hrs/moMonthly capacity100Speakers$95/hrFrom

French (Western) Language Training Dataset - 1000H Spontaneous Pair Conversational Audio and Video

French (Western) · France

1000 hours of French (Western) spontaneous conversations with metadata and transcripts.

Vietnamese Language Training Dataset - 2000H Spontaneous Pair Conversational Audio and Video

Vietnamese · Vietnam

2000 hours of Vietnamese spontaneous conversations with metadata and transcripts.

Tagalog Language Training Dataset - 2000H Spontaneous Pair Conversational Audio and Video

Tagalog · Philippines

2000 hours of Tagalog spontaneous conversations with metadata and transcripts.

Bengali Language Training Dataset - 2000H Spontaneous Pair Conversational Audio and Video

Bengali · Bangladesh

2000 hours of Bengali spontaneous conversations with metadata and transcripts.

French (African) Language Training Dataset - 2000H Spontaneous Pair Conversational Audio and Video

French (African) · DR Congo

2000 hours of French (African) spontaneous conversations with metadata and transcripts.

2,000 hrs/moMonthly capacity200Speakers$90/hrFrom

Arabic MSA (Modern) Language Training Dataset - 2000H Spontaneous Pair Conversational Audio and Video

Arabic MSA (Modern) · Saudi Arabia

2000 hours of Arabic MSA (Modern) spontaneous conversations with metadata and transcripts.

1,500 hrs/moMonthly capacity150Speakers$85/hrFrom

Bulgarian Language Training Dataset - 1500H Spontaneous Pair Conversational Audio and Video

Bulgarian · Bulgaria

1500 hours of Bulgarian spontaneous conversations with metadata and transcripts.

Hebrew Language Training Dataset - 500H Spontaneous Pair Conversational Audio and Video

Hebrew · Israel

500 hours of Hebrew spontaneous conversations with metadata and transcripts.

Korean Language Training Dataset - 500H Spontaneous Pair Conversational Audio and Video

Korean · South Korea

500 hours of Korean spontaneous conversations with metadata and transcripts.

1,000 hrs/moMonthly capacity100Speakers$90/hrFrom

Czech Language Training Dataset - 1000H Spontaneous Pair Conversational Audio and Video

Czech · Czechia

1000 hours of Czech spontaneous conversations with metadata and transcripts.

Yoruba Language Training Dataset - 2000H Spontaneous Pair Conversational Audio and Video

Yoruba · Nigeria

2000 hours of Yoruba spontaneous conversations with metadata and transcripts.

Polish Language Training Dataset - 1000H Spontaneous Pair Conversational Audio and Video

Polish · Poland

1000 hours of Polish spontaneous conversations with metadata and transcripts.

500 hrs/moMonthly capacity50Speakers$75/hrFrom

Tamil Language Training Dataset - 500H Spontaneous Pair Conversational Audio and Video

Tamil · India

500 hours of Tamil spontaneous conversations with metadata and transcripts.

Swahili Language Training Dataset - 2000H Spontaneous Pair Conversational Audio and Video

Swahili · Kenya

2000 hours of Swahili spontaneous conversations with metadata and transcripts.

Punjabi Language Training Dataset - 500H Spontaneous Pair Conversational Audio and Video

Punjabi · India

500 hours of Punjabi spontaneous conversations with metadata and transcripts.

Telugu Language Training Dataset - 500H Spontaneous Pair Conversational Audio and Video

Telugu · India

500 hours of Telugu spontaneous conversations with metadata and transcripts.

500 hrs/moMonthly capacity50Speakers$75/hrFrom

Catalan Language Training Dataset - 500H Spontaneous Pair Conversational Audio and Video

Catalan · Spain

500 hours of Catalan spontaneous conversations with metadata and transcripts.

1,500 hrs/moMonthly capacity150Speakers$75/hrFrom

Serbian Language Training Dataset - 1500H Spontaneous Pair Conversational Audio and Video

Serbian · Serbia

1500 hours of Serbian spontaneous conversations with metadata and transcripts.

1,000 hrs/moMonthly capacity100Speakers$75/hrFrom

Italian Language Training Dataset - 1000H Spontaneous Pair Conversational Audio and Video

Italian · Italy

1000 hours of Italian spontaneous conversations with metadata and transcripts.

Japanese Language Training Dataset - 500H Spontaneous Pair Conversational Audio and Video

Japanese · Japan

500 hours of Japanese spontaneous conversations with metadata and transcripts.

Arabic (Levantine) Language Training Dataset - 500H Spontaneous Pair Conversational Audio and Video

Arabic (Levantine) · Lebanon

500 hours of Arabic (Levantine) spontaneous conversations with metadata and transcripts.

500 hrs/moMonthly capacity50Speakers$90/hrFrom

Arabic (Gulf) Language Training Dataset - 500H Spontaneous Pair Conversational Audio and Video

Arabic (Gulf) · Saudi Arabia

500 hours of Arabic (Gulf) spontaneous conversations with metadata and transcripts.

Arabic (Egyptian) Language Training Dataset - 2000H Spontaneous Pair Conversational Audio and Video

Arabic (Egyptian) · Egypt

2000 hours of Arabic (Egyptian) spontaneous conversations with metadata and transcripts.

1,500 hrs/moMonthly capacity150Speakers$65/hrFrom

Arabic (Darija) Language Training Dataset - 1500H Spontaneous Pair Conversational Audio and Video

Arabic (Darija) · Morocco

1500 hours of Arabic (Darija) spontaneous conversations with metadata and transcripts.

Amharic Language Training Dataset - 2000H Spontaneous Pair Conversational Audio and Video

Amharic · Ethiopia

2000 hours of Amharic spontaneous conversations with metadata and transcripts.

Danish Language Training Dataset - 500H Spontaneous Pair Conversational Audio and Video

Danish · Denmark

500 hours of Danish spontaneous conversations with metadata and transcripts.