Ändra sökning
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf
Seshat: A sync system for Audiobooks and eBooks
Högskolan Väst, Institutionen för ingenjörsvetenskap, Avd för data- och elektroteknik.
Högskolan Väst, Institutionen för ingenjörsvetenskap, Avd för data- och elektroteknik.
2014 (Engelska)Självständigt arbete på grundnivå (kandidatexamen), 10 poäng / 15 hpStudentuppsats (Examensarbete)
Abstract [en]

In this degree project we present a way to construct a synchronization system that is able to create a timings file, which is the file the system uses to know how to sync the eBook and audiobook, using speech recognition and estimation algorithms. This file is then used by the system to let the user select a sentence and have the audiobook start reading from that sentence, or vice versa. This system can create these files with a mean offset from a manu-ally timed file which is within our expectations for the system.

We use estimation algorithms to fill in the blanks where the speech recognition falls short. Speech recognition accuracy is typically between 40-60%, sometimes dipping lower, so there are blanks to fill in. Using basic algebraic principles of calculating velocity we can ex-trapolate the speed of a reader, using the duration of the audiobook as the time and the amount of characters written as the distance. For increased accuracy we derive this value on a per-chapter basis.

Using this method we are able to create accurate files, which the user can use to freely sync any location in the book. Our system is designed to work for any book in the world that does not have an audiobook which cuts off between sentences in the audio files.

We manually create timings files for four different books with widely varying publishing dates, author styles, reader style and gender to create as wide and representative a testing pool as possible for the project

Ort, förlag, år, upplaga, sidor
2014. , s. 27
Nyckelord [en]
Speech recognition, Audiobooks, eBooks, EPUB, MP3, XML, Synchronization, Sync
Nationell ämneskategori
Systemvetenskap, informationssystem och informatik med samhällsvetenskaplig inriktning
Identifikatorer
URN: urn:nbn:se:hv:diva-6887Lokalt ID: EDT501OAI: oai:DiVA.org:hv-6887DiVA, id: diva2:757213
Ämne / kurs
Datateknik
Utbildningsprogram
Datateknisk systemutveckling
Handledare
Examinatorer
Tillgänglig från: 2014-10-30 Skapad: 2014-10-21 Senast uppdaterad: 2014-11-14Bibliografiskt granskad

Open Access i DiVA

fulltext(1487 kB)1331 nedladdningar
Filinformation
Filnamn FULLTEXT01.pdfFilstorlek 1487 kBChecksumma SHA-512
5070fdb463fb6337fffc0c65809d6721acf994ef0795a84d06f5cfe6d910a7231ae66fb8fd7a282b23b138a7f55ddffa558c38cefcccf202e71ac99dc1ae54a4
Typ fulltextMimetyp application/pdf

Av organisationen
Avd för data- och elektroteknik
Systemvetenskap, informationssystem och informatik med samhällsvetenskaplig inriktning

Sök vidare utanför DiVA

GoogleGoogle Scholar
Totalt: 1331 nedladdningar
Antalet nedladdningar är summan av nedladdningar för alla fulltexter. Det kan inkludera t.ex tidigare versioner som nu inte längre är tillgängliga.

urn-nbn

Altmetricpoäng

urn-nbn
Totalt: 835 träffar
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf