News du lundi 03 mars
Apple sera en retard pour son nouveau Siri
D'après Mark Gurman, le nouveau Siri devait être dévoilé en juin 2025 à la WWDC d'Apple.
Toujours d'après lui il devrait intégrer l'ancien système et ses capacités ainsi que de l'IA de type LLM pour permettre des échanges conversationnels.
Il rapporte que Siri serait en retard sur les 3 nouveautés annoncées par Apple l'an dernier.
Et pourrait sortir en septembre 2025, donc avec 3 mois de retard.
Je peux confirmer ce retard, le nouveau Siri ne devrait sortir complet qu'en septembre 2025 avec iOS 19, mais avec un ajout de taille et probablement essentiel: identifier les émotions dans la voix et être capable de réagir en conséquence.
Notamment la peur, la détresse, la colère, le dégoût, le mépris, la joie, le calme, etc.
Outre les émotions, il y aura le niveau d'implication dans la conversation avec Siri qui sera analysé et évalué par celui-ci, là aussi pour diriger ses réponses.
Aussi la reconnaissance de l'environnement, conversation entre personnes, télé ou musique en fond, voiture, etc. Un point de donnée en plus pour comprendre le contexte.
Les plans d'Apple n'intégraient pas cela l'an dernier et c'est vers la mi-février de cette année qu'ils ont lancé cela à toute vitesse, en mettant de coté d'autres projets, qui eux aussi pourraient n'arriver qu'en septembre avec iOS 19.
Comme celui-ci pour comparer les langues et leurs variantes...
Ce nouveau projet pour Siri est appelé chez Apple en interne "Voice Distress" ou "Voice Affect" sur les différentes documentations et outils dont celui développé par Scilliance et accédé depuis un navigateur avec une authentification via AppleConnect.
Un outil d'écoute d'extraits de conversations téléphonique, avec généralement l'interlocuteur filtré (plus ou moins bien), et d'annotation des émotions, de l'implication ainsi que des bruits ou conversations autour.
Ils ont depuis peu des annotateurs de données qu'Apple a certifié, qui travaillent sur de vieux enregistrements téléphoniques (délivrés via cette URL) au profil suivant: entre 1994 et 2014, des locuteurs ayant une éducation supérieure et entre 30 et 60 ans en général, principalement Américains avec quelques Anglais, mais quasiment jamais depuis une voiture (étrange!) et quasiment jamais avec de la peur.
Le dernier point étant un problème en soi pour l'identification de cette émotion forte et essentielle.
Très certainement le nouveau Siri ne pourra être prêt pour juin 2025 comme espéré, mais il pourrait être meilleur que prévu grâce à la reconnaissance des émotions, de l'implication et même de types d'environnement (voiture, conversation entre personnes, fond sonore).
Data Annotator / Annotateur de Données
J'ai été "Data Annotator" ou Annotateur de données en février 2025.
Entre deux autres choses, je vend mon travail comme consultant, comme salarié, et là comme esclave payé 11,64€ de l'heure, du coté de 10€ de l'heure après impôts.
Ça n'était pas cette mirifique paye qui m'a attiré, mais découvrir ce qu'est un Annotateur de Données, ayant moi-même plusieurs projets liés aux IA.
Le client a été surprenant pour ma pomme.
J'ai été pris comme deux autres dans une mini-équipe car maîtrisant une langue (le français) ainsi qu'une de ses variantes, capable de les identifier et les séparer proprement, et capable de s'exprimer et de comprendre une troisième ou au moins son sabir employé aux USA.
En aucune manière bilingue ou traducteur, ce qui a été vendu au "client" qu'il ne fallait jamais nommer, même entre collègues, surtout pas sur la messagerie d'entreprise.
Même les captures d'écran en cas de problème étaient interdites.
Client qui a été abusé, mon employeur lui a menti sur mes qualifications et celles de mes collègues, aucun n'étant ni traducteur ni bilingue, j'étais même le seul à maîtriser la variante du français sur laquelle nous devions travailler, une variante très riche dont je peux retracer les origines dans le français de Baudelaire quand traduisant Edgar Allan Poe!
J'ai d'abord été exposé à des traductions de termes de services et autres merdes pseudo-légales sur les sites web, leur mode d'emploi aussi. C'est totalement abrutissant, et ça n'a été que le début. Le texte original en anglo américain pseudo-légal en***lage de mouche. Le bonheur!
Et comparer le rendu dans deux langues que je maîtrise, pour voir lequel correspond le mieux à l'objectif fixé.
J'ai rapidement du changer de projet, une urgence, car le "client" fruité amenant un nouveau projet, ce coup-ci nécessitant de vrais bilingues ou parlant nativement Américain.
Et me voilà embarqué comme mes 2 autres collègues nativement francophones dans une aventure où nous devons écouter des conversation téléphoniques, principalement d'Américains et quelque fois d'Anglais (à l'oreille la différence est évidente).
Sauf que ma pomme en a pris plein la poire!
Drogue, violence, viol, mineurs, j'ai tout entendu, tout noté, maladies aussi.
J'ai eu droit à tout, et quand je me pensais blindé j'ai craqué sur une conversation parlant d'un patient atteint depuis longtemps d'une maladie, de ses effets secondaires et que maintenant il s'était enfoncé dans l'indicible, sans retour...
Sérieusement, j'étais vraiment paumé là?!?
Etes-vous tenté par le nouveau Mac mini M4 ?
Total des votes : 3447