2. La transmission et la réception : phonétique acoustique (suite)

 

2.1. Généralités

2.1.1. Physiologie et acoustique

2.1.2. L’étude proprement dite.

2.2. Caractéristiques acoustiques des voyelles.

2.2.1. Visualisation.

2.2.2. Étude de l’amplitude des sons non entravés.

2.2.3. Étude du temps d’émission des sons non entravés.

2.2.4. Remarques sur les fréquences et conclusion.

2.3. Caractéristiques acoustiques des consonnes.

2.3.1. Visualisation et premières remarques.

2.3.2. Étude de l’amplitude des sons entravés et interprétation des visualisations précédentes.

__________________________________________________________________________

 

C’est le son non entravé le plus fréquent du système vocalique vezo. Il donne déjà des indices sur la façon de parler du vezo. Emission peu tendue des sons comme en français, voyelles surtout centrales, peu d’action des lèvres et des préférences pour la position arrière de la langue comme on le verra en phonétique physiologique. Les sons [a] à très faible amplitude se trouvent en général en fin de groupe de souffle. En outre, ils sont brefs, très assourdis et parfois indiscernables pour une oreille non avertie. Les périodes, la plupart du temps, sont nombreuses, distinctes et on peut facilement les compter. Il faut noter parfois une modulation souple et graduelle des amplitudes. Chaque période est assez lisse et son mouvement est ample. [a] a une attirance pour l’accent d’intensité. Il est émis souvent sur un temps long surtout quand l’amplitude augmente. C’est le son le plus facile à prononcer puis que tous les organes phonateurs sont au repos ou presque. Il est souvent infecté par les sons [w], [i] et les nasales qui le suivent.

[â]

 

amplitude 0 : /

amplitude 0,5 : /

amplitude 1

 

 

amplitude 2 : /

 

amplitude 3

 

amplitude 4

 

 

 

 

 

-[ñ]

[m]-[ñ]

 

 

 

[f]-[n]

 

[j]-[n]

amplitude 5 : /

amplitude 6

 

 

amplitude 7

 

 

amplitude 8

 

 

[i]-[n]

[j]-[m]

 

[i]-[n]

[e]-[m]

 

[l]-[ñ]

amplitude 9 : /

amplitude 10 : /

Une des caractéristiques de la langue vezo est sa fréquente nasalité. On y découvre plusieurs variantes du son [n] qu’on étudiera plus loin en plus du [m]. De ce fait, nombre de voyelles en sont affectées, notamment le [a]. Le [ê] noté ci-après, du fait de sa rareté, ne confirme pas la suite de la démonstration. En outre, les périodes du [a] et du [n] (ou [ñ]) sont semblables. Il n’y a pas de transition brusque entre [a] et une nasale. Peut-être est-ce pour cela que le [a] se nasalise à son contact. Mais il ne semble pas exister en vezo de « vraies » voyelles nasales comme en français. On tentera de le démontrer dans la suite de cette étude.

[ê]

amplitude 0 : /

amplitude 0,5 : /

amplitude 1 : /

amplitude 2 : /

amplitude 3 : /

amplitude 4 : /

amplitude 5 : /

amplitude 6

 

 

[j]-[n]

 

amplitude 7 : /

amplitude 8 : /

amplitude 9 : /

amplitude 10 : /

Le peu de cas relevés ne permet pas des commentaires approfondis. Mais comme [â] , on note une variation de l’amplitude qui pourrait aussi dénoter une nasalisation de [e].

2.2.2. Etude de l’amplitude des sons non entravés

Les cas étudiés sont beaucoup plus nombreux que les visualisations précédentes et pourra donc faire l’objet d’un affinement assez poussé dans la présentation des résultats. En outre, toutes les visualisations des sons étudiés n’ont pas été rapportées afin de ne pas grossir exagérément et inutilement l’ouvrage. Seules les données numériques des observations ont été prises en compte pour les résultats donnés ultérieurement.

L’écartement des cordes vocales conditionne l'amplitude de la vibration. L'amplitude détermine pour une fréquence donnée, l'intensité du son musical (sa puissance mesurée en décibels) et dépend de la pression de l'air pulmonaire. Plus la pression de l'air contenu dans les poumons est forte, plus les cordes vocales s'écartent et plus le son est perçu comme fort. On verra aussi que les sons étudiés précédemment affectionnent chacun une préférence pour certaines amplitudes. Ils présentent aussi une certaine similitude avec les degrés d’aperture analysés en phonétique physiologique. Procédons au classement de ces sons à partir des statistiques suivantes (environ 2500 voyelles traitées) :

[u]

amplitudes
occurrences
 
0
7
0,5
11
1
30
2
28
3
12
4
9
5
5
6
2
7
1
8
0
9
0
10
0

Total = 105 occurrences

[i]

amplitudes
occurrences
 
0
14
0,5
31
1
61
2
68
3
20
4
14
5
4
6
0
7
2
8
0
9
0
10
0

Total = 214 occurrences

[i]

amplitudes
occurrences
 
0
12
0,5
8
1
12
2
14
3
5
4
3
5
4
6
3
7
1
8
0
9
0
10
0

Total = 62 occurences

[ê]

amplitudes
occurrences
0
0
0,5
0
1
0
2
0
3
4
4
3
5
1
6
1
7
0
8
0
9
0
10
0

Total = 9 occurrences

[w]

amplitudes
occurrences
0
0
0,5
1
1
3
2
6
3
8
4
7
5
3
6
6
7
1
8
0
9
0
10
0

Total = 35 occurrences

[o]

amplitudes
occurrences
0
0
0,5
1
1
1
2
7
3
8
4
15
5
4
6
6
7
2
8
0
9
0
10
0

Total = 44 occurrences

[e]

amplitudes
occurrences
0
0
0,5
9
1
14
2
19
3
20
4
25
5
30
6
23
7
9
8
3
9
0
10
0

Total = 152 occurrences

[â]

amplitudes
occurrences
0
0
0,5
0
1
2
2
1
3
2
4
8
5
5
6
15
7
14
8
8
9
3
10
0

Total = 58 occurrences

[ae]

amplitudes
occurrences
0
0
0,5
1
1
0
2
2
3
5
4
7
5
6
6
12
7
7
8
7
9
0
10
0

Total = 47 occurrences

[r]

amplitudes
occurrences
0
0
0,5
0
1
0
2
3
3
1
4
3
5
7
6
9
7
4
8
0
9
0
10
0

Total = 27 occurrences

[a]

amplitudes
occurrences
0
1
0,5
9
1
4
2
12
3
31
4
39
5
35
6
90
7
106
8
76
9
6
10
0

Total = 410 occurrences

[δ], non significatif

Entre [e] et [o] = [ϑ], non significatif

[ ɛ ], non significatif

Entre [u] et (e) = [ j], non significatif

Entre [i] et [u] = [ y], non significatif

[y], non significatif

Procédons à une interprétation des courbes obtenues.

Lorsqu’on visualise les sons sur un écran d’ordinateur au moyen d’un logiciel simulant un oscilloscope, on s’aperçoit que les ondes qui se déroulent dans le temps au même rythme que la parole émise ne se dessinent pas n’importe comment. Une certaine harmonie se crée dans la représentation des sons émis.

Une première constatation part de deux faits. Premièrement, pour chaque son émis semble correspondre en moyenne, surtout si l’on travaille sur de nombreux exemples, un même train d’ondes. Un [p] émis est tout à fait différent d’un [s] ? De même, la période d’un [a] semble différente de celle d’un [i]. Deuxièmement, pour un même son, l’amplitude de la vibration augmente avec l’intensité du son. Un [a] clair, sonore, puissant, fournit une amplitude beaucoup plus forte qu’un [a] assourdi.

Ces deux paramètres simultanés, au vu de nombreuses observations portant sur plusieurs milliers de sons entravent réellement l’élaboration d’une éventuelle classification des sons en fonction de leur amplitude. En effet, si un [a] assourdi a la même amplitude qu’un [i] puissant, les résultats sont brouillés. Cette constatation est valable si l’observation se fait sur un trop petit nombre d’exemples. Par contre, si elle se fait sur des centaines d’exemples, on note des différences intéressantes permettant une première classification des sons. Il est important aussi de noter que la personne enregistrée parlait en général sur un même registre : débit et intensité de la voix homogène puisqu’elle racontait une histoire très différente d’une discussion surtout si celle-ci est animée. On peut donc faire abstraction de l’intensité des sons et surtout se référer à leur nature.

Une première étude porte tout d’abord sur les voyelles, représentées précédemment, sons non entravés. Malgré le nombre nettement insuffisant des sons étudiés, on peut déjà se faire une première idée. On constate que pour chaque son analysé, la courbe culmine pour une amplitude donnée là où les occurrences sont les plus nombreuses. Elle a une allure de courbe de Gauss. En moyenne, le son [i] par exemple, « préfère » l’amplitude 1,75 sur un axe noté de 0 à 10 (Rappel : 0 représente un son totalement sourd, 0,5 un son plus ou moins assourdi). En moyenne, [e] a une amplitude générale de 5. Pour [a], c’est 7. Peut-on, à partir de ces observations effectuées, noter un début de conclusion ? Sur ce terrain, il faut rester d’une extrême prudence car trop de paramètres entrent en jeu. N’oublions pas qu’un son est rarement émis seul. Il y a toujours un entourage qui peut l’infecter de façon importante. En vezo, un [a] est souvent nasalisé ou semi-nasalisé par le [n] qui le suit. Placé à la fin d’un groupe de souffle après une consonne sourde, il peut être en partie ou totalement désonorisé. Un [i] entre deux [t] peut se transformer en [i] ou devenir totalement sourd. Les amplitudes évoquées plus haut évidemment en subissent fortement l’influence.

Donc l’entourage phonique, le débit accéléré ou fortement ralenti, l’intensité du son émis, la constitution même des organes en jeu peuvent modifier fortement les amplitudes.

Cependant, d’un point de vue statistique, on note ce fait intéressant : il semble y avoir un rapport entre ces amplitudes et la position des organes lors de l’émission de ces sons par l’appareil phonateur. Des sons comme [a] et [e] émis avec des organes relâchés (en position de repos) produisent des amplitudes plus fortes. Par contre, des sons produits avec des organes phonateurs tendus : étirement des lèvres (cas relativement rare en vezo à la différence du français), position arrière de la langue, produisent des sons aux amplitudes faibles.

On note que [u], [i], [i] sont des sons « étroits ». [e], [w], [o], [e] sont des sons « moyens ». [â], [ae], [e], [a] sont des sons « larges ».

Il est intéressant de noter que les sons de base (ou dit « purs » ?) et là, on est obligé d’anticiper légèrement, s’opposent nettement sur le plan physiologique, ce qu’on repère moins sur le plan acoustique.

([u], [i]) <---> ([e]) <---> ([a])

Pourquoi [u] et [i] ont pratiquement même amplitude et pourtant se distinguent nettement l’un de l’autre ? Il faut pour cela, regarder les organes mis en jeu. Tout simplement, [i] est produit à l’avant de la bouche et [u] à l’arrière.

Un premier schéma, et on en restera là, tant qu’on n’aura pas fini l’étude physiologique, montre comment s’organise provisoirement le système phonétique vocalique vezo.

 

sons
codes
amplitudes
[u]
1
1
[i]
2
2
[i]
3
2
[ê]
4
3
[w]
5
3
[o]
6
4
[e]
7
5
[â]
8
6
[ae]
9
6
[r]
10
6
[a]
11
7

 

Sons avant

Sons centraux

Sons arrières

(anticipation physiologique)

[i]

[i]

[u]

 

 

[ê]

[w]

 

 

[o]

(amplitudes correspondant
aux graphes précédents)

 

[e]

 

 

[ae] ...............................[â]

[r]

 

 

[a]

 

Dans un premier temps, on peut classer les sons non entravés vezo en trois groupes :

- les sons dits fermés : [u], [i], [i]

- les sons semi-ouverts : [ê], [w], [o], [e]

- les sons ouverts : [â], [æ], [r], [a]

Les sons les plus fréquemment utilisés, dits de base, sont [u], [i], [e], [a], les autres pouvant être considérés comme intermédiaires et pouvant être influencés par les sons voisins comme dans l’exemple suivant : [izai] qui devient, si le locuteur parle très vite [izæj]. On peut visualiser le système « vocalique » vezo de la façon suivante :

Notons que les sons de base apparaissent fréquemment, que les sons intermédiaires sont moins nombreux et que les sons mal perçus apparaissent très rarement ce qui plaide en faveur du caractère subjectif de cette perception même.

1
410
2
210
3
150
4
102
5
60
6
55
7
50
8
48
9
35
10
30
11
10
12
9
13
8
14
1
15
1
16
0
17
0,5
 
[a]
[i]
[e]
[u]
[ i ]
[â]
[æ]
[o]
[ w ]
[ r ]
[ê]
[ e ]
[δ]
[y]
[φ]
[φ]
[oe]

Il est possible aussi que l’entourage phonique immédiat de chaque son modifie sensiblement son amplitude comme nous l’avons déjà suggéré. L’étude faite ici porte, comme on l’a dit, environ sur 2500 voyelles, nombre très nettement insuffisant puisque les phonatomes qui en dérivent, antérieurs et postérieurs, tournent autour de dix dans chaque cas. Rappelons qu’un phonatome est l’ association de deux sons, ou d’un son et d’un silence immédiats dans la chaîne parlée. On a, par exemple, dans la suite [m][a][n], quatre phonatomes [*m], [ma], [an] et [n*] (* est un silence). Dans la suite de notre travail, nous ne prendrons pas en compte les silences. L’étude d’un phonatome est sujette à moins d’erreurs d’interprétation que l’étude d’un seul son car lorsqu’on passe d’un son au son suivant, il faut tenir compte de l’importance des transitions. Quand on synthétise la parole, il vaut mieux mettre bout à bout des phonatomes que des sons simples pour obtenir une très nette amélioration de l’écoute. Malheureusement, il faut compter environ un millier de phonatomes différents par langue. Dans cette étude donc, il est impossible d’interpréter correctement l’ensemble des visualisations des amplitudes correspondantes. Cependant un essai dont nous ne rendrons pas compte ici montrait des différences notoires d’un phonatome à l’autre. L’étude sans doute serait fort intéressante à effectuer mais déborde ici inconsidérément le cadre de notre recherche .

2.2.3. Étude du temps d’émission des sons non entravés

Le temps d’émission des voyelles (ou sons non entravés) a-t-il une valeur informative en vezo ? Là aussi, le nombre d’occurrences pris en compte est nettement insuffisant et il faudra rester prudent sur de possibles interprétations. Mais on peut déjà faire quelques remarques simples.

Le temps d’émission d’une voyelle en vezo dépasse très rarement la demi-seconde et qui est dû plutôt à un fait suprasegmental. En général, il est de l’ordre du dixième de seconde. Ce temps d’émission est-il influencé par la proximité des autres sons ? Seule une étude approfondie et très longue des phonatomes correspondants aurait pu apporter quelques éléments de réponse.

Tout au plus, on peut constater que les sons de base en moyenne sont plus brefs que les sons mixtes sauf pour [ i ]. Pour ces sons de base, une correspondance très nette se fait entre leur temps d’émission et leur amplitude. Plus l’amplitude est faible, plus le temps d’émission est bref et inversement. Les sons mixtes pourtant dont le temps d’émission est en moyenne deux fois plus long, suivent aussi cette loi. Par exemple, [w], situé entre [o] et [u], sons relativement brefs, est émis plus rapidement que [æ] situé entre [e] et [a], sons relativement longs. C’est [â] qui, subissant le phénomène de la nasalisation met le plus de temps à être émis.

Mais, paradoxalement, si on excepte le [â] qui subit fortement l’influence du son qui le suit, les sons « purs » possèdent une bande (ou plage) d’émission temporelle possible deux fois plus longue statistiquement que les sons mixtes (v. les graphes correspondants) : de 0 à 35/100 seconde en moyenne pour les sons « purs » et de 0 à 17/100 seconde pour les sons mixtes. Quelle interprétation faut-il en donner ? Pour le moment, on est sans réponse.

Une étude a été faite aussi sur le temps d’émission des sons entravés. Après réflexion, les graphes correspondant à chaque son ne seront pas rapportés dans un chapitre ultérieur car la plupart ne présentent pas de pic maximal et l’étendue des bandes d’émission temporelle n’est pas significative sauf pour les sons dits vocaliques comme [n] ou [m] dont l’intérêt correspondant s’arrête là.

Par contre, [j] et [w] ont cette fois-ci été rangés et provisoirement parmi les sons non entravés car ils présentent avec eux une forte similitude : pic maximal à 4/100 de seconde pour [j] et à 4,5/100 de seconde pour [w]. La courbe de [j] est plus « pointue » que la courbe de [w] qui est nettement « arrondie ».

Ainsi, comme pour les amplitudes, les temps d’émission suivent des lois qu’on aurait pu affiner si les occurrences étudiées avaient été plus nombreuses. On pense qu’il existe un lien entre l’amplitude et le temps d’émission, lien qui paraît très complexe.

Les sons. Etude du temps (en centièmes de seconde)

[i]

Temps
Occurrences
1
7
2
13
3
8
4
9
5
5
6
6
7
4
8
5
9
1
11
1
12
1
24
1
Total
61

[i]

Temps
Occurrences
2
7
3
22
4
36
5
23
6
11
7
19
8
8
9
7
10
12
11
4
12
2
13
9
14
5
15
2
16
4
18
2
19
3
21
3
22
2
23
2
24
3
29
1
31
1
33
1
34
1
39
1
52
1
Total
192

[u]

Temps
Occurrences
1
4
2
8
3
11
4
14
5
11
6
7
7
8
8
8
9
1
10
7
11
4
12
4
14
1
15
1
16
1
17
2
19
1
20
3
21
1
22
1
23
2
24
1
34
2
37
1
Total
104

[e]

Temps
Occurrences
2
3
3
8
4
14
5
18
6
12
7
19
8
9
9
5
10
8
11
10
12
6
13
7
14
1
15
3
16
2
17
5
18
4
19
2
20
1
21
1
23
2
24
2
25
1
26
1
30
2
31
2
34
2
35
1
36
2
Total
153

[a]

Temps
Occurrences
2
2
3
20
4
24
5
58
6
57
7
52
8
40
9
27
10
19
11
15
12
20
13
6
14
8
15
7
16
7
17
5
18
6
19
8
20
3
21
4
22
6
23
7
24
1
26
3
29
1
31
1
33
1
Total
408

[w]

Temps
Occurrences
3
3
4
5
5
2
6
8
7
4
8
4
9
2
10
2
11
2
12
1
13
1
14
2
15
1
Total
37

 

[o]

Temps
Occurrences
3
3
4
3
5
3
6
7
7
1
8
7
9
6
10
5
11
2
12
2
13
2
14
1
15
2
16
1
17
1
Total
46

 

[r]

Temps
Occurrences
3
3
4
2
5
4
6
4
7
5
8
4
9
2
11
1
12
1
14
2
15
1
Total
29

 

[ae]

Temps
Occurrences
3
4
4
3
5
3
6
5
7
5
8
10
9
4
10
5
11
1
12
2
13
2
14
1
17
1
18
2
Total
48

 

[â]

Temps
Occurrences
2
2
4
2
5
4
6
4
7
6
8
9
9
11
10
2
11
4
12
3
14
3
15
1
16
1
17
1
18
1
19
2
20
1
21
1
26
1
Total
59

 

[j]

Temps
Occurrences
1
1
2
5
3
11
4
23
5
14
6
4
7
4
8
4
10
2
11
4
13
2
17
1
20
1
Total
76

 

[w]

Temps
Occurrences
1
1
2
10
3
14
4
19
5
18
6
10
7
6
8
8
9
3
10
8
11
3
12
1
Total
101

Tableau comparant les temps d'émission et les amplitudes des sons non entravés

voyelles

temps « moyen » d’émission en 1/100 s

plages d’émission temporelles possibles en 1/100 s

amplitudes moyennes de 0 à 10

[i]

2

24

2

[i]

4

52

2

[u]

4

37

1

[e]

4 à 7

36

5

[a]

5 à 7

33

7

[w]

5 à 8

15

3

[o]

6 à 9

17

4

[r]

5 à 8

15

6

[æ]

8

18

6

[â] ?

(8 à 9)

(26)

(6)

[j]

4

20

variables

[w]

4 à 5

12

variables

 

ACCUEIL