Test Details
Voir le résultat
Mizike iko vilé polepole na mayele
tuko na cheza , polepole ma mayele
tuko na cheza , na muna kani
polepole , na mayele(music it like that- slowly comes in the mind)
(and make you dance and it comes in the mind)
(it make you dance , it ’s a celebration)
(slowly it comes in the mind)
Accéder aux fichiers
Fin test
Cela a plusieurs avantages:
- permet de copier-coller des extraits du texte original
- permet d’obtenir une version épurée en vue d’une réédition
- rechercher manuellement à l’intérieur du fichier
- ajouter le contenu du document à un index de plusieurs fichiers
Test #1
La source est une photo de mauvaise qualité, avec une mise en page en colonnes:
Voir le résultat
Mizike iko vilé polepole na mayele
tuko na cheza , polepole ma mayele
tuko na cheza , na muna kani
polepole , na mayele(music it like that- slowly comes in the mind)
(and make you dance and it comes in the mind)
(it make you dance , it ’s a celebration)
(slowly it comes in the mind)
Accéder aux fichiers
On notera
- les colonnes sont parfaitement détectées et le rendu respecte la mise en page d’origine
- la reconnaissance de caractère est parfaite, pas une seule faute à corriger
Test #2
Une photo d’un texte à peine lisible:
Voir le résultat
U RADINI GOSTI DOSHIILE
Traditonnel bulgare
TU RA-ADINI GOSTI-L DO-OSHLE MALE MO BASS
U RA-ADINI GOSTI DOSHLE RADO MO U-URADLINLLLI GO-0-OSTI
DOSHLE RADO MO-O
REFRAIN
VIDI MOMINE POD GYULUM ZASPALA
X2GYU-UL SE RONI PO LITSE-E-I-I PADA
“BASS
E… VIDI VIDI POD GYULUM ZASPALAGYULSE RONI PO-O LI…TSE-E-I-I PADA
l GOSTI DOSHLI KON DO-OVELI MALE MO
I NA KONYA SINYO SE-EDLO RADO MO
Accéder aux fichiers
On notera
- Excellent !
- les colonnes ne sont pas reconnues
- quelques fautes dans la reconnaissance des caractères
Test #4
Un texte en arabe pris en photo avec un téléphone
Voir le résultat
سر اومد زمستون» شکفته بهارون گل سرخ خورشید باز اومد و شب شد گریزون
کوهها لالمز ارن» لالهها بیدارن تو کوهها دارن گل گل گل آفتابو میکارن
Source: https://archive.org/download/paroles/saromadzemestoun.jpg.pdf Source: https://archive.org/download/paroles/saromadzemestoun.jpg_djvu.txt
Test #4
Un fichier de 340 pages pour 22 Mo:
PDF de Karaoke chorales
Il passe de 22 Mo à 15 Mo avec en plus le texte surimprimé !
Source: https://archive.org/download/carnets-chorales
Tests en vrac, à rédiger
structure complexe:
-
Avant : <https://archive.org/download/chmob/Ligo/Ligo - Paroles - version Chmob.pdf>
-
Après : https://archive.org/download/chmob/Ligo/Ligo%20-%20Paroles%20-%20version%20Chmob_djvu.txt
-
Avant: https://archive.org/download/paroles/22%20-%20Amor%20d%27Aussau.pdf
-
Après : https://archive.org/download/paroles/22%20-%20Amor%20d%27Aussau_djvu.txt
-
https://archive.org/download/paroles/A%20la%20orilla%20del%20Rio.pdf
-
https://archive.org/download/paroles/A%20la%20orilla%20del%20Rio_djvu.txt
Parfois ça ne marche pas
avec un background, qques glitch:
- https://archive.org/download/paroles/Los%20enfants%20de%20la%20luna.jpg.pdf
- https://archive.org/download/paroles/Los%20enfants%20de%20la%20luna.jpg_djvu.txt
interessant: photo et arch semble galérer à identifier la langue et du coup c’est dégueux