Plagiatori, aveti o problema. Mare de tot! - Interviu

Luni, 18 Noiembrie 2013, ora 10:40
30641 citiri
Plagiatori, aveti o problema. Mare de tot! - Interviu
Foto:scribendi.com

O echipa de specialisti in IT a lansat recent primul si singurul soft de detectare a plagiatului 100% romanesc. Utilizarea acestui soft este GRATUITA.

Echipa de programatori care a pus la punct DetectarePlagiat.ro precizeaza ca programul face verificari complexe inclusiv in propozitii si fraze similare, citate lipsa sau inexacte si permite utilizatorului sa vada online textul care a fost plagiat.

Ziare.com a discutat cu Dragos, unul dintre cei trei membri ai echipei care a realizat acest soft menit sa faca putina curatenie in sistemul de invatamant romanesc.

Cine sunteti? Cati oameni au lucrat la acest proiect si cat timp? Care au fost costurile?

Suntem o echipa de programatori seniori care au avut sansa de a lucra la nivel international la mai multe proiecte de anvergura, proiecte ce au presupus elaborarea si implementarea unor programe software ce au necesitat un conglomerat de tehnici pluridisciplinare: algoritmi de inteligenta artificiala, programare neurolingvistica computerizata, dezambiguizare semantica si analiza lingvistica computerizata, dar si de extragerea si exploatarea de date si de cunostinte din baze de date.

Programul DetectarePlagiat.ro nu a fost elaborat in scopuri comerciale astfel incat nu putem estima costurile. Am inregistrat domeniul DetectarePlagiat.ro in luna septembrie a anului 2012 si am lucrat la scrierea codului atunci cand timpul ne-a permis, dezvoltarea programului intinzandu-se pe o perioada de aproximativ 14 luni.

In tot acest timp am fost 3 programatori care am dezvoltat un ansamblu de tehnici de analiza si de scripturi care permit programului nostru sa detecteze in mod eficient similitudinile textuale suspecte si paragrafele copiate dintr-o sursa sau mai multe surse si care se regasesc in textul supus investigatiei.

DetectarePlagiat.ro analizeaza si scaneaza anti-plagiat in peste 10 miliarde de resurse.

Cum v-a venit ideea, ce v-a motivat, ce scop urmariti si de ce ati ales sa puneti softul la dispozitie gratuit?

In ultimii ani am dezvoltat mai multe proiecte in domeniul educatiei, iar la inceputul anului 2012, la cererea unui client german, am dezvoltat un program care presupunea dezvoltarea unei solutii care sa ascunda plagiatul din texte in limbile engleza, spaniola, germana si franceza, facandu-l imposibil de detectat cu metodele actuale de verificare a originalitatii.

Pe parcursul dezvoltarii si testarii acestui proiect, am constatat existenta unui numar limitat de programe de detectie a plagiatului si lipsa unui program de detectie a plagiatului specific in mai multe limbi, printre care si limba romana. Toate acestea se bazeaza pe analiza textului in limba engleza, o buna parte nefiind cu adevarat utilizabile pentru detectarea si analiza plagiatului in documente academice, ci mai degraba niste unelte destul de rudimentare pe care nu te poti baza.

Intrucat algoritmii, metodele si tehnicile de detectare a plagiatului nu au fost facute publice de catre dezvoltatorii programelor existente, sau nu le-am gasit sigure sau complete, am fost nevoiti sa aprofundam fenomenul de scanare si detectie a plagiatului si de asemenea sa cercetam algoritmii in baza carora similitudinea textuala constituie sau nu plagiat si procentul in care este analizat si exprimat. De asemenea, am fost nevoiti sa facem o analiza amanuntita si documentata a programelor actuale de detectare a plagiatului si o multitudine de teste, analize si comparatii pentru a putea onora comanda clientului german in ceea ce priveste ascunderea plagiatului.

In timpul dezvoltarii si testelor efectuate am constatat ca validarea originalitatii unui text scris in limba franceza, germana sau spaniola prezenta rezultate fals pozitive prin utilizarea unor programe de verificare a plagiatului dezvoltate de/si pentru vorbitori de limba engleza. Noi fiind vorbitori nativi de limba romana am gasit si descarcat de pe Internet cateva sute de lucrari de licenta si am efectuat stagii de testare si pentru texte redactate in limba romana si am constatat, de asemenea, rezultatele fals pozitive (acestea fiind doar cateva dintre neajunsurile descoperite).

Datorita faptului ca partea de analiza, algoritmi si cercetare a plagiatului a fost facuta in mod amanuntit pentru proiectul amintit anterior, ne-am gandit ca daca tot nu exista pana la aceasta ora un program romanesc de detectare a plagiatului special conceput pentru limba romana, cu siguranta noi il putem dezvolta. Pentru noi a fost un test si anume ne-am gandit sa vedem daca mica noastra echipa poate dezvolta un program similar sau mai bun decat al unei armate de programatori ce lucreaza pentru gigantii de pe piata internationala a detectarii de plagiat... si am reusit, spunem noi.

Noi castigam din abilitatile noastre de specialisti IT si nu avem nici timpul si nici cunostintele necesare pentru promovarea si monetizarea programului, noi stim sa facem soft nu sa vindem. Este posibil insa, pe viitor, in cazul in care programul va fi utilizat si isi va dovedi eficacitatea, universitatile sa doreasca implementarea unor solutii interne dedicate privind detectia plagiatului si, de ce nu, sa obtinem si contracte de dezvoltare a softului conform cerintelor individuale ale acestora. Majoritatea solutiilor libere open source de succes au la baza acest principiu.

Cum functioneaza acest soft si ce trebuie sa faci daca vrei sa verifici o lucrare care nu e in format electronic, ci e tiparita?

Programul nostru de detectare a plagiatului se descarca gratuit se descarca gratuit de pe site, se instaleaza cu numai cateva click-uri in calculator si apoi se introduce documentul pentru care se doreste verificarea similaritatilor textuale.

DetectarePlagiat.ro este compatibil cu sistemul de operare Windows 8, Windows 7, Windows Vista. Nu functioneaza pe Windows XP, in Mac si Linux. Versiunea actuala este capabila sa scaneze fisiere word de tipul doc si docx, si inca suntem in stadiul de beta-testare pentru fisiere pdf, html, odt, txt.

Pentru varianta tiparita, avem in lucru un proiect pe care il vom dezvolta in viitorul apropiat, o solutie software ce presupune un mecanism OCR prin care programul poate recunoaste automat scrisul prin scanare optica (Optical Character Recognition). Cu alte cuvinte pornind de la o imagine scanata a unui text dintr-o lucrare de licenta sau doctorat, prin metode specifice identificam textul si il salvam intr-un fisier ce va putea fi prelucrat cu un procesor de text si apoi scanat anti-plagiat.

Ati testat softul pe vreunul dintre plagiatele care au starnit scandaluri publice, cum ar fi teza de doctorat a premierului Victor Ponta?

Nu, noi suntem programatori, iar abilitatile noastre sunt acelea de a scrie programe care pot fi folosite de cei interesati de aceste aspecte. Suntem mult prea "mici" pentru politica de la acest nivel si nici nu suntem interesati de acest aspect.

In schimb, pentru testarea softului nostru, am descarcat de pe Internet cateva mii de documente in limba romana, majoritatea lucrari de licenta, disertatie si de doctorat, sustinute in ultimii ani si am constatat existenta intr-un procent alarmant de mare a plagiatului.

Ce urmeaza? Inregistrati produsul la ORDA? Intentionati sa il promovati intens in mediul universitar?

Inscrierea in Registrul national al programelor pentru calculator (la ORDA) se poate face doar de catre persoane juridice insa nu ne facem probleme intrucat dreptul de autor este un drept recunoscut de lege si se naste odata cu materializarea codului sursa (codului pentru programul de detectare a plagiatului in cazul nostru), prin simplul fapt al realizarii codului ce sta la baza functionarii acestui program.

Suntem primul si singurul soft de detectare a plagiatului 100% romanesc, dezvoltat pentru analiza, verificarea si detectarea plagiatului din documentele in limba romana si datorita specificitatii detectiei plagiatului in limba romana si a algoritmului de depistare al coeficientului de plagiat, nici nu cred ca in viitor vor mai aparea alti dezvoltatori pentru acest segment, poate doar preluari ale programelor de pe limba engleza.

Intrucat dezvoltarea programului de detectare a plagiatului este pentru noi o activitate pro-bono, nu vedem cel putin deocamdata necesitatea infiintari unei persoane juridice numai pentru a putea face inscrierea la ORDA.

Pana acum am trimis cateva sute de emailuri universitatilor romanesti (acolo unde acestea au afisate pe website-ul propriu modalitatea de contact prin email). Am pornit de la lista institutiilor de invatamant superior afisata pe site-ul Ministerului Educatiei, insa spre surprinderea noastra nu am primit decat cateva reactii.

Fie emailurile inca nu au fost citite, fie nimeni nu isi da interesul asupra managementului originalitatii, desi legea Educatiei nationale numarul 1/2011 prevede ca: "Indrumatorii lucrarilor de licenta, de diploma, de disertatie si de doctorat raspund in solidar cu autorii acestora de asigurarea originalitatii continutului acestora".

Speram ca, in timp, programul nostru de detectare a plagiatului sa fie promovat printre studenti "din gura in gura", cum se spune, sau de catre website-urile si blogurile care au disponibilitatea si interesul promovarii pro-bono a unui astfel de program care este oferit gratuit de catre dezvoltatori. Intrucat demersul nostru este indreptat spre cresterea calitatii continutului de informatie atat in mediul academic cat si in cel online si intrucat noi dezvoltatorii am decis sa nu percepem nici un cost pentru descarcarea si utilizarea acestui program de detectare a plagiatului speram sa gasim disponibilitatea altor oameni din online pentru promovarea acestui produs necesar online-ului romanesc.

Urmeaza asa cum spuneam anterior, o versiune ce poate prelucra fisiere in formate pdf, html, odt, txt precum si verificarea antiplagiat a documentelor tiparite precum si versiuni pentru Linux si Mac.

De asemenea suntem in discutii cu o companie din domeniul detectarii plagiatului la nivel international pentru implementarea metodelor noastre ce vor face ca algoritmii privind detectarea plagiatului sa fie imposibil de pacalit.

Printre planurile noastre de viitor se numara si lansarea programului antiplagiat si pentru limba engleza franceza, germana si spaniola. Versiunea in limba engleza exista deja si este functionala, insa lansarea ei nu poate avea loc din lipsa timpului disponibil.

Ciolacu este sigur de victoria lui Firea la Capitală: ”Va câștiga şi cu Piedone, şi fără Piedone”
Ciolacu este sigur de victoria lui Firea la Capitală: ”Va câștiga şi cu Piedone, şi fără Piedone”
Indiferent dacă Cristian Popescu Piedone se va retrage sau nu din cursa electorală, Gabriela Firea va fi noul primar al Capitalei, este convins Marcel Ciolacu. Premierul a precizat miercuri,...
Ciolacu susține că nu există riscul ruperii coaliției: ”Ce voiaţi? Să stau la televizor să spun: "m-am gândit eu că e mai bun Piedone"?”
Ciolacu susține că nu există riscul ruperii coaliției: ”Ce voiaţi? Să stau la televizor să spun: "m-am gândit eu că e mai bun Piedone"?”
Marcel Ciolacu nu crede că decizia privind candidaturile separate la Primăria generală a Capitalei va afecta în vreun fel coaliția formată din PSD şi PNL. El susţine că membrii alianţei...
#detectare plagiat soft romanesc, #program detectare plagiat romana , #universitati