Tematikus, strukturált, nyomtatott oldalak szövegének felismerése Javában (MS)

Karakter- ill. szövegfelismerési probléma esetén ma már rengeteg szolgáltatás és könyvtár áll a fejlesztő rendelkezésre. A legtöbbjük általános célú, csupán a képet alakítja szöveggé, de semmiféle támpontot nem nyújt bizonyos elemek azonosításához. Pedig strukturált oldalak  digitalizálása esetén ez a következő lépés, amelyet el kell végezni.

A hallgató(k) feladata olyan alkalmazás készitse, amely számlák képéből egy külső karakterfelismerő program által előállitott nyers szövegből a számlák adatait (eladó adatai, vásárlás helye és időpontja, vásárolt tételek, mennyiségek és összegek stb.) kinyeri.

Angol szöveg (dokumentáció) olvasás alapján történő megértése a téma felvételének előfeltétele.

A Morgan Stanley különböző informatikai és matematikai témákban önálló labor, diplomamunka és gyakornoki lehetőséget biztosít diákoknak. Amennyiben a fenti téma felkeltette érdeklődésedet vagy valamilyen hasonló témában szeretnél Morgan Stanley-s külső konzulenssel együtt dolgozni, kérlek jelezd ezt a Morgan Stanley-s kollégánknak.

Témavezető: Dr. Surányi Gábor (Morgan Stanley)