logo delicious         Le partage d'événements est un service expérimental  

Les messages de la liste echos du Risc

[these, poste] Open PhD/postdoc positions on machine learning, NLP, speech processing and a bit of vision, LIMSI-CNRS, Orsay, Fr
(13/07/2017)

De : "'Claudia Pichon-Starke' claudia.starke [ chez ] lpl-aix.fr [lpl-infos]" lpl-infos-noreply [ chez ] yahoogroupes.fr
De la part de Hervé Bredin

Open PhD and postdoc positions at LIMSI - CNRS, Orsay, France

Automatic enrichment of TV series and movies transcripts

Keywords : natural language processing, speech processing, machine learning, deep learning

The goal of this project is to fully exploit the audio stream to automatically enrich speech transcripts and subtitles of TV series and movies with the name and position of the characters.


speaker A — "Nice to meet you, I am Leonard, and this is Sheldon. We live across the hall."

speaker B — "Oh. Hi. I’m Penny."


speaker A — "Sheldon, what the hell are you doing?"

speaker C — I am not quite sure yet. Do you know where Howard lives?


Just looking at these two short conversations, a human can easily infer that "speaker A" is actually "Leonard", "speaker B" is Penny and "speaker C" is Sheldon. The objective of this project is to combine natural language processing, speech processing, and computer vision to do the same automatically.

More details: https://mycore.core-cloud.net/public.php?service=files t=2b5f5a79d24ac81c3b3c371fcd80734b


------
Message redirigé par le relais d'information sur les sciences de la cognition (RISC) sans virus
http://www.risc.cnrs.fr. Pour des raisons de sécurité, cette liste ne transmet pas les pièces jointes.

Cette liste est modérée. Pour envoyer un message à la liste, écrire à : Pourinfos [ chez ] risc.cnrs.fr

Vous disposez d'un droit d'accès, de modification, de rectification et de suppression de la liste de diffusion. Pour l'exercer adressez vous à : Pourinfos [ chez ] risc.cnrs.fr