Common Voice Scripted Speech 23.0 - Huautla Mazatec
Locale: mau
Size: 197.87 MB
Task: ASR
Format: MP3
License: CC-0
[Énná] — Huautla Mazatec (mau)
Esta ficha técnica corresponde a la versión 23.0 del conjunto de datos de voz guiada de Mozilla Common Voice para Huautla Mazatec (mau). El conjunto de datos contiene 11 horas de grabaciones (11 horas validadas) de 7 hablantes.
Idioma
El mazateco (ÉNNÁ) pertenece a la familia Otomangue y sub familia popoloca mazateca, esta lengua se habla los estados de Puebla, Veracruz y principalmente en el estado de Oaxaca donde se ubican la mayor parte de la población mazateca, ahí podemos encontrar, Mazateco Occidental, Mazateco Mazatlán, Mazateco del centro, Mazateco centro oriental, Mazateco Ayautla, Mazateco Chiquihuitlán, Mazateco de Jalapa, Mazateco de Ixcatlán y Mazateco de Soyaltepec. En este articulo encontraras Mazateco del centro que comprenden los municipios de Santa María Chilchotla, Huautla de Jiménez, San José Tenango, Santa María la Asunción y San Miguel Huautapec, pero específicamente el trabajo esta centrado en la variante de la localidad de Puerto Buenavista perteneciente al municipio de San José Tenango, es decir, Mazateco del centro. La división política que se menciona en este texto se extrajo del libro Norma para la escritura del mazateco.
Información demográfica
El conjunto de datos incluye la siguiente distribución de edad y género.
Género
Información de género autodeclarada, el porcentaje se refiere al número de clips anotados con este género.
Género | Porcentaje |
---|---|
Undefined | 65.0% |
Female Feminine | 35.0% |
Edad
Información de edad autodeclarada, el porcentaje se refiere al número de clips anotados con este rango de edad.
Rango de edad | Porcentaje |
---|---|
Twenties | 21.0% |
Thirties | 43.0% |
Fourties | 36.0% |
Corpus de texto
El cuerpo del trabajo o las oraciones fueron escritas por el propio autor refiriéndose a situaciones de la vida cotidiana en el campo, en la casa, en el trabajo y en todas la actividades que se viven a diario en la comunidad.
Sistema de escritura
En este trabajo se respeto el sistema de escritura de la Norma de escritura del idioma mazateco.
Tabla de símbolos
b ch f j k l m n ñ r s t ts x y nd ng nds nch mb jm jn jñ tj kj tsj jm jn jñ tj kj tsj chj sj jm jn jñ tj kj tsj chj sj jnd jng ntj nkj ntsj nchj
Muestra
A continuación se muestran cinco oraciones seleccionadas aleatoriamente del corpus.
Nijin titjuñá
¿Jmé xi macheén?
Chitu ndí ntsjin í.
Ntjo ngajin nandá.
Naxín tijnakjare tii.
Muestras automáticas aleatorias
Jngu stsá tsakʼiere tii ngajín liji.
¿Ndiyá ʼñu lojo tjín?
Ñú kjín kjí nutsé nga kjinkʼa.
Xka yá nimá sʼejin yojojá.
Je tibʼé xuʼnda na.
Fuentes
Propia
Procesamiento
Todo el corpus fue basado en vivencias de la vida diaria en el campo, la casa y en el trabajo que se realiza en una comunidad.
Postprocesamiento recomendado
Qué tipo de procesamiento le recomendarías a una persona que quiere usar estos datos?
Enlaces comunitarios
Autores de la ficha técnica
Jesús Méndez García garciajesusm28@gmail.com María Agustina Méndez García Divina Cecilia Méndez García Gladis González Jiménez Diego Orestes Méndez García
Licencia
Este conjunto de datos se publica bajo la licencia Creative Commons Zero (CC-0). Al descargar estos datos usted acepta no determinar la identidad de los hablantes en el conjunto de datos.