GINOP Pályázat
Asyst Solutions GINOP pályázata: GINOP-2.1.7-15-2016-00879
a kedvezményezett neve: ASYST Solutions Üzleti Tanácsadó és Informatikai Zártkörűen Működő Részvénytársaság
a projekt címe: Intelligens egészségügyi archív adat feldolgozó és kereső rendszer prototípusának kifejlesztése. A SCRIN (Scan, Capture, Recognize, Intelligent, Indexing) STORE&SEARCH; prototípus
a szerződött támogatás összege: 48 211 179 (negyvennyolcmillió-kétszáztizenegyezer-százhetvenkilenc) Ft
a támogatás mértéke: 61 %
a projekt tervezett befejezési dátuma: 2018.07.31.
projekt azonosító száma: GINOP-2.1.7-15-2016-00879
Asyst Solutions GINOP pályázata: GINOP-2.1.7-15-2016-00879
A) Támogatási kérelem szakmai tartalmának összefoglaló bemutatása.
Mára szerte a világban és Magyarországon is átállás történik az egészségügyben keletkező adatok (páciensek, betegségek, diagnózisok, jelentések, kezelések, stb.) elektronikus alapon történő tárolására és kezelésére (EHR – electronic health record), mely javítja az egészségügyi ellátórendszer egyes intézményeinek valós idejű együttműködését, így a rendszer hatékonyságát, ezáltal az adott terület népessége számára nyújtott egészségügyi szolgáltatások színvonalát. Az EHR vagy PHR (personalized health record) rendszerekre történő áttérés ugyanakkor csak részben, az átállást követően keletkező egészségügyi adatok tárolására, feldolgozására és megosztására képes, a múltban keletkezett papír alapú, továbbá a jelenben/jövőben, de nem EHR adatstruktúrával keletkezett egészségügyi adatok rendszerbe töltését nem oldja meg. A projektünk keretében egy olyan ún. “end-to-end” termék és szolgáltatás prototípus megoldást kívánunk kifejleszteni, mely önmagában képes a múltban keletkezett hagyományosan papír alapú egészségügyi adatok tok (leletek, diagnózis, jelentések – szöveges és képi) eletronikus feldolgozására, értelmezésére, és hitelesítésére, majd a kulcsinformációk kinyerésére, indexálására és azok struktúrálatlan módon “Big Data” alapú történő letárolására, melyből az egyes kulcsinformációk megadásával és egy nem strukturált keresőeszköz kifejlesztésével kinyerhetőek a betegellátáshoz szükséges múltbeli információk. A rendszer az indexált keresőlogika segítségével képes lesz a kinyert hiteles információkat összevetni az EHR rendszerekben tárolt adatokkal és azokból “intelligens” összefüggéseket is kiolvasni (pl. örökletes betegségek esetén a szülő múltbeli kezelésének adatai). A rendszer az aggregációs képességei révén lehetőséget teremt időben és térben esetleg távol eső aggregált információk megjelenítésére (járványok terjedése, időbeli és térbeni összehasonlíthatóság, stb.), azaz az egészségügyben keletkezett adatok másodlagos (akár anonim) hasznosítására is. A SCRIN (scan, capture, recognize, intelligent, indexing) STORE&SEARCH; termék prototípust a feldolgozási folyamat teljes egészét lefedő rendszerként valósítjuk meg. A megoldás hardver oldalon egy nagyteljesítményű beolvasó rendszerrel (recognition server) és a rá épülő OCR (optical character recognition) rendszerre épül, mely magában foglalja a dokumentum hitelesítési eljárást is. A beolvasott dokumentumok letárolását saját “Big Data” alapú indexálási rendszer fejlesztésével valósítjuk meg, melynek részét képezi (első körben magyar, de ez nyelvektől függetlenül továbbfejleszthető) egy beépített egészségügyi terminológia szótár és menedzsment szint. Erre épül a szintén szabadstruktúrájú keresőeszközünk, mely az adatok közötti – adott esetben – rejtett összefüggések feltérképezésére is képes. Végül a kifejleszteni tervezünk az aggregált adatok megjelenítésére képes jelentéskészítő és vizuális megjelenítő eszközt is. Miért “Big Data”? Akár a múltban keletkezett papíralapú dokumentumok feldolgozásakor, akár a jelenlegi EHR rendszerek adatstruktúráinak megváltozásakor szembe kell nézni egy olyan nehézséggel, hogy akár a régi dokumentumok minősége-olvashatósága miatt, akár a bennük lévő adattartalom miatt, az adatstruktúrák változatosak. Ha egy információ nem betölthető egy előre definiált adatstruktúrába, akkor azt nem strukturált módon, azaz “big data” jelleggel szükséges letárolni. A “big data” jelleget tovább erősíti a kép alapú (röntgen, fotó, stb.) alapú információk tárolására és indexálására irányuló igény is. Ezen adatok feldolgozását az ún. HADOOP platformon kívánjuk megvalósítani, amely nem csak a strukturálatlan adatok tárolásának és feldolgozásának lehetőségét teremti meg, hanem ún. elosztott módon képes az információk feldolgozására költséghatékony módon. Célcsoport meghatározása A fejleszteni kívánt prototípus célcsoportja egyértelműen és jól körülhatárolható – az egyes országok eltérő egészségügyi rendszereitől függően – azok az egészségügyi integrációs intézmények, melyek az egészségügyi intézményrendszer fenntartói vagy az intézmények együttműködését támogató szervezetek állami –és/vagy magánintézmények, továbbá maguk az ellátó intézmények. A magyar piac esetében ez leginkább az ÁEEK (volt Gyemszi), a külföldi, európai intézményekre vonatkozó információkat a piackutatás keretében kívánjuk feltárni.
B) A megvalósítandó tevékenységek részletes bemutatása.
Piackutatás és innovációmenedzsment – Projektötlet nemzetközi benchmark készítése – H2020 kapcsolódó projektjeinek elemzése – A prototípus dobozos termékké, könnyen reprodukálható megoldássá tétele és ennek analízise Alapinfrastruktúra és fejlesztői környezet felállítása A fejlesztés első lépéseként a szükséges hardver és szoftverelemek együttműködését teremtjük meg. Ennek keretében felállításra kerül az adatfeldolgozást végző szerver számítógép, a beolvasó-berendezés és a hozzá kapcsolódó nagy teljesítményű szövegfelismerő szoftver, az ABBYY FlexiCapture. Ez utóbbi szoftver, melyet hivatalos magyarországi kereskedelmi képviselője a fejlesztés időtartamára ingyenesen bocsát rendelkezésünkre, egy újgenerációs intelligens, pontos és nagymértékben skálázható adatrögzítő és dokumentum-feldolgozó szoftver. Egységes belépési pontot biztosít a különböző, tetszőleges felépítésű és összetettségű űrlapok és dokumentumok üzletileg felhasználható kész adatokká történő automatikus átalakítására. Big Data rendszer fejlesztése A prototípus központi rendszerének megtervezése, logikai és fizikai rendszerterv készítése. Ezt követően fejlesztjük ki a nyílt hadoop platformra épülő, az adatok nem strukturált módon való tárolásának és indexálásának módszertanát, melynek megalapozásához alapos módszertani kutatását végezzük el. A kutatást követően kerül meghatározásra az indexálási metodika, mely a legújabb ún. „nem strukturált” adatkezelési eljárásokra alapozunk. A megfelelő adattárolási és indexálási módszertan meghatározását követően kerül a rendszer központi eleme programozásra. Kimeneti és vizualizációs felület fejlesztése Az elektronikusan beolvasott és letárolt adatok visszakereshetőségének és egyes adatok más adatokkal való összevetésének megteremtése mellett fontos, hogy a kapott adatokat a prototípus felhasználói számára megjeleníthetővé és értelmezhetővé tegyük. Ennek céljából kerül kifejlesztésre egy ún. kimeneti interfész (alkalmazásprogramozási felület), mely megteremti annak lehetőségét, hogy a már kinyert adatokat a magyarországi, vagy akár nemzetközi sztenderek szerinti EHR (electronic health record) vagy PHR (Personal Health Record) struktúrában bocsássa a felhasználó rendelkezésére. A kimeneti interfész mellett egy online térképpel támogatott vizualizációs felület létrehozását is megvalósítjuk, mely lehetővé teszi az egyes egészségügyi adatok (betegségek, kezelések, stb.) földrajzi megjelenítését is. Tesztelés (- innováció-menedzsment, – funkcionális tesztek, -terheléses tesztek) A programozás lezárultával egy újabb innováció-menedzsment eljárás keretében meghatározásra kerülnek a fejlesztés dobozos termékké formálásának javasolt módjai és lehetőségei, valamint egy kutatás keretében meghatározzuk a rendszer értékesítési és árpolitikáját. Ezzel párhuzamosan elvégezzük a rendszer funkcionális és próbaadatokra épülő terheléses tesztjét is, mely révén betekintést nyerhetünk a termék skálázódási képességeire, valamint az esetleges továbbfejlesztési lehetőségeire is.
C) A létrejövő eredmények bemutatása.
A projektjavaslat milyen új, üzletileg hasznosítható termékek, szolgáltatások, eljárások prototípus fejlesztését célozza. A projektünk keretében megvalósítani kívánt prototípus kifejlesztése egy olyan „dobozos megoldás” létrehozására irányul, mely egy, az elektronikus egészségügyi rendszerek fejlődését, illetve továbbhasznosítását teszi lehetővé. Mára a fejlett országok egészségügyi rendszerei – függetlenül az adott ország egészségbiztosítási és finanszírozási modelljétől – a legtöbb esetben elektronikus alapúak. Ez már nem csak az egyes egészségügyi intézményekben használt medikai rendszerekre, hanem a teljes populációra alkalmazott, egységes elektronikus egészségadat (EHR) rendszerre is igaz. Ezzel ugyanis megteremtődik annak az alapja, hogy az egyes intézmények – a beteg felhatalmazása alapján – egymással betegadatokat kicseréljenek ezáltal elkerüljék a drága és gyakran feleslegesen elvégzett vizsgálatokat (ha már az rendelkezésre áll egy intézmény nyilvántartási rendszerében). Ugyanakkor ezek a rendszerek nem képesek a bevezetésük előtt – papír alapon, vagy akárcsak más adatstruktúrában – keletkezett adatok feldolgozására. Projektünk eredményeképpen olyan megoldást hozunk létre, amely feldolgozza a régi, papír alapú medikai adatokat (akár kép, vagy szöveges formátumban), azokat indexálja és újra kereshetővé teszi. Ezáltal, további adatbányászati vagy hálózatkutatáson alapuló feldolgozási módszerekkel nem csak az egészségügyi adatok és beavatkozások térbeli eloszlásai, hanem olyan az egészségügyi rendszer stratégiai fejlesztéséhez szükséges adatsorok is előállíthatóak, melyek rávilágítanak olyan összefüggésekre is, mint hogy mely betegségek között lelhető fel szoros együttjárás, illetve mely betegségekre jellemző hasonló populációs mintázat. Az egyes betegségek idősoros összevetései alapján kiolvasható, hogy mely betegségek populációs mintázatai függnek össze az életkorral és nemi eloszlással, majd ezen idősoros adatokkal és a KSH populációs prognózisai alapján becslést tettünk az esetszámok jövőbeni alakulására. Versenytársak Tekintettel arra, hogy a „big data” típusú adatfeldolgozás önmagában is még az útkeresés fázisában jár, az a jellemző, hogy hasonló projektek inkább egyedi fejlesztés, egy-egy részigény lefedésére készülnek. Több, elsősorban az Egyesült Államokban létrejövő megoldás ismert (pl. Aurora Healthcare, Milwauke; Healthx platform több egészségügyi intézmény kiszolgálására; Treato.com, stb.), ezek azonban nagyrészt magánvállalkozások kezdeményezéseiként jelennek meg és kínálják adatfeldolgozási képességeiket az egészségügyi intézmények számára. Ha eltekintünk a kizárólag „big data” alapú adatfeldolgozási megoldásoktól és kibővítjük a lehetséges versenytársak körét a hagyományos adatbányászattal foglalkozó vállalatokra, akkor ezek között minden nagy, a világpiacon jelentős részesedéssel bíró nemzetközi céget megtaláljuk; IBM SPSS, SAS, Microsoft Analisys Server, R, Rapidminer, KNIME. Úgy gondoljuk, hogy sem a fejlesztő, sem pedig az egyes rendszerek bevezetését végző munkatársak számával, sem pedig ezen világcégek adatbányászati divízióinak árbevételével rövid távon nem tudunk versenyezni. Hisszük ugyanakkor, hogy néhány éven belül a fejlesztésre fordított erőforrásaink megtérülését biztosítani tudjuk.
D) Kérjük, részletezze, hogy a projektjavaslat milyen újdonságot és szellemi hozzáadott értéket tartalmaz.
A projekt két alapvető területen tartalmaz innovatív, magas szellemi hozzáadott értékkel bíró megoldást. A világ egészségügyi informatika piacán – más részpiacokhoz hasonlóan – terjedőben vannak a „big data” alapú adatfeldolgozási rendszerek. Tekintettel arra, hogy maga a big data elnevezés sem kiforrott, egységes technológiát takar, sokkal inkább egy új adattárolási, feldolgozási és visszakereshetőségi problémahalmazt jelöl, azt egyfajta útkeresésként lehet jellemezni. Terjedőben vannak olyan alaptechnológiák – ilyen például a Google mérnökei által létrehozott Hadoop platform -, melyek a big data problematikára próbálnak válaszokat találni. A big data probléma alapja, hogy az adatok nem rendszerszerűen és nem is kötött formátumban állnak rendelkezésre, hanem struktúrálatlan módon, szöveges, képi, esetenként hang formájában. Ugyanakkor az igény a valós idejű döntéshozatalhoz az is szükséges, hogy az adatból értékes információ váljon. A rendszerünk megvalósításával, a még nem aggregált, személyes egészségügyi adatok feldolgozására, és indexálására, így az adat információvá való konvertálására vállalkozunk. Noha léteznek kísérletek a világ egészségügyi informatikai piacán az egészségügyben keletkezett adatok „big data”-szerű feldolgozására, ismereteink szerint az EHR kapcsán keletkezett adatok vonatkozásában, különösen a fejlett országok medikai rendszereit kezdik felkészíteni a historikus papír alapú egészségügyi adatok befogadására, ezek jellemzően egyedi fejlesztési projektként valósulnak meg. Az elsődleges újdonságtartalom tehát, hogy „big data” alapú megoldást fejlesztünk, a ma még jellemzően strukturált módon tárolt adatok feldolgozása mellé. A másik fontos újdonsága a fejlesztésünknek, hogy nem csupán a jelenben vagy közelmúltban keletkezett adatok új típusú tárolására, hanem a múltban keletkezett, elektronikus formában nem létező adatok feldolgozását is megcélozzuk.
E) Kérjük, mutassa be, hogy a projektjavaslat, milyen technológiai fejlesztést valósít meg, vagy ahhoz hogyan kapcsolódik.
A fejlesztendő prototípussal szembeni támasztott elvárásunk, hogy a legmodernebb „big data” technológiák felhasználásával átütő, iparági példamodellt állítson az egészségügyi EHR adatok kezelésével, egyúttal biztosítsa a személyes, de elektronikusan még nem létező betegadatok integrációját. Annak érdekében, hogy a rendszerünkből valós időben, akár területi, akár idősoros aggregált adatok is kinyerhetőek legyenek, szükséges, hogy minél nagyobb számú betegadat legyen a rendszer számára elérhető. Rendszerünk valós életben történő használatba vétele esetén valószínűsíthető, hogy sok esetben kevés új információt tartalmazó adatok is tárolásra kerülnek. A statisztikában, képfeldolgozásban vagy a mesterséges intelligencia fejlesztések területén már használatosak olyan módszerek melyek automatikusan képesek elkülöníteni a hasznos dimenziókat a kevésbé hasznosaktól (pl. főkomponens-analízis, vagy az attribútumok közötti hasznossági sorrend felállításában a „feature ranking” eljárások). Fejlesztésünk technológiai újszerűségét az adja, hogy olyan dimenziócsökkentési algoritmusokat fejlesztünk, hogy azok hatékonyan használhatóak legyenek „Big Data” környezetben is.
F) A megvalósítási helyszín(ek) alkalmasságának bemutatása.
A megvalósítási helyszín, melyet cégünk 2015 második negyedéve óta bérel, Fejér megye központjában, Székesfehérváron, a Vállalkozói Központ Alapítvány Inkubátorházában van, ahol 4 állandó és 2 mobil munkahelyen, szélessávú interneteléréssel, korszerű irodai környezetben tudnak kollégáink dolgozni. A munkakörnyezet egy tárgyalóhelyiséggel párosulva egyaránt megteremti a hatékony egyéni projektmunkát és a közös projektmegbeszélések megtartását is. Az irodaház az M7 autópályától nem távol, igen jól megközelíthető helyen van, mely a nem helyben élő kollégák munkavégzését is hatékonyan támogatja.
Forrás: https://www.palyazat.gov.hu