On Sun, 2025-06-29 at 23:43 +0200, Pierre Estrem wrote:
Bonjour,
Je continue à explorer la reteranscription textuelle depuis une dictée vocale et autant que possible sans retardement...
Le lien dessous recommande un "GPU NVIDIA with CUDA..." : https://www.tecmint.com/whisper-ai-audio-transcription-on-linux/
Une recherche sur ce qu'est un "GPU Nvidia with CUDa" m'amène à des cartes graphiques AMD dotées de "ZLUDA" compatibles avec des
applications "CUDA".
C'est hors de prix (> 1000€).
J'ignore si un co-processeur vectoriel spécialisé est véritablement nécessaire
pour un tel logiciel de transcription automatique vocale. Puisque un signal sonore (perceptible par un humain) c'est 44KHz d'échantillonnage (sur un CD Audio) avec 16 bits par échantillon. Avec l'âge on entend moins bien mais un humain même âgé comprend la parole.
J'imagine que des techniques dites de réseaux de neurones artificiels sont pertinents. Une bibliothèque libre en C++ comme
https://www.mlpack.org/ ou comme
https://gudhi.inria.fr/index.html (cette dernière étant française) sont
alors utiles, et ne requierent pas de matériel spécialisé.
Mon point de vue est que techniquement c'est accessible par n'importe quel processeur x86-64 actuel.
J'attire l'attention de tous sur cette liste que CUDA est défini et propre à la
société NVIDIA
Une alternative un peu plus portable est la norme OpenCL (qui peut être compilée
sur materiel NVIDIA ou ATI/AMD et même sur un processeur Intel ou AMD sans coprocesseur graphique).
https://fr.wikipedia.org/wiki/OpenCL
De plus tout code écrit en CUDA ou en OpenCL dépend fortement du matériel précis, et ce code doit être modifié à chaque changement de matériel.
Enfin, les supercalculateurs comme
https://www.genci.fr/ existent, ils sont sous
Linux et avec de nombreux coprocesseurs. Cf
https://top500.org/ pour une liste.
Il existe des procédures documentées pour y louer du temps calcul. Voir aussi
https://www.teratec.eu/
Librement
--
Basile STARYNKEVITCH <
basile@starynkevitch.net>
8 rue de la Faïencerie
http://starynkevitch.net/Basile/
92340 Bourg-la-Reine
https://github.com/bstarynk
France
https://github.com/RefPerSys/RefPerSys
--- SoupGate-Win32 v1.05
* Origin: fsxNet Usenet Gateway (21:1/5)