Salut, sunt Adelina. Am ales tema pentru licență în informatică aplicată după o „căutare” de o săptămână prin Google, discuții cu colegii și câteva idei de la profesor. În final m-am hotărât pe un subiect legat de inteligența artificială în analiza datelor medicale – părea cool și „la modă”.
Acum, la câteva luni de la început, îmi dau seama că am făcut câteva greșeli:
– Am ales o temă prea largă, iar în faza de cercetare m-am pierdut în volumul de literatură.
– Nu am verificat dacă am la dispoziție datele necesare – am pierdut timp încercând să găsesc seturi de date accesibile.
– Am subestimat complexitatea implementării și am ajuns să lucrez în weekenduri târzii.
Ați trecut și voi prin ceva similar? Ce sfaturi aveți pentru a nu cădea în aceleași capcane? Orice idee e binevenită!
Carina:
Hey Adelina, în primul rând, felicitări că ai reușit să ajungi până aici – nu e ușor să te menții pe drumul licenței, mai ales când tema e „la modă” și promite să fie „cool”.
Iată câteva chestii care m-au ajutat (și sper să-ți fie la fel de utile):
- Delimitează‑te subiectul – când tema e prea largă, încearcă să găsești un „nucleu” clar. De exemplu, în loc de „inteligență artificială în analiza datelor medicale”, poți să te concentrezi pe „detectarea anomaliilor în imagini de radiografie pulmonară cu rețele CNN”. Astfel, ai un set de metode și un tip de date bine definite, iar volumul de literatură devine mai gestionabil.
- Verifică datele înainte de a te arunca în cercetare – eu am pierdut săptămâni încercând să găsesc un set de date public, doar ca să aflu că are restricții de licență. Înainte să te hotărăști pe un subiect, caută rapid pe Kaggle, OpenML, sau pe portalurile de date ale instituțiilor medicale (ex. MIMIC‑III). Dacă găsești un set de date, verifică dimensiunea, formatul și dacă există documentație. Dacă nu e disponibil, poți să propui să colectezi datele tu (cu acorduri de etică) sau să alegi un subiect cu date deja pregătite.
- Planifică‑ți sprint‑urile – am învățat pe calea grea că weekend‑urile nu sunt locul ideal pentru cod. Încearcă metoda Pomodoro + backlog: împarte lucrarea în task‑uri mici (ex. „scrie review‑ul pentru 5 articole despre X”, „implementare preliminară a modelului Y”). Apoi alocă‑ți 2‑3 ore pe zi, cu pauze regulate. Dacă ai un calendar, blochează‑ți timpul ca pe niște „meetinguri” cu tine însuți.
- Folosește un manager de referințe – Zotero/ Mendeley îți pot salva ore de căutare. Crează colecții pe sub‑teme (ex. „preprocesare imagini”, „metrici de evaluare”) și adaugă note scurte. La final, bibliografia se generează automat.
- Discută cu profesorul/mentorul – nu subestima puterea unui feedback rapid. Trimite‑i un draft de plan de lucru la fiecare 2‑3 săptămâni; dacă vezi că te abati de la traseu, poți corecta din timp. De multe ori, profesorii au acces la seturi de date interne pe care nu le găsești în public.
- Testează rapid, nu perfecționează de la început – în faza de prototip, folosește modele simple (ex. logistic regression, SVM) pentru a verifica dacă datele sunt potrivite. Dacă nu, nu pierde timp să „optimizați” un model complicat care nu funcționează de la bun început.
- Păstrează‑ți energia – licența nu e o cursă de sprint, e un maraton. Ia-ți timp pentru sport, plimbări, și nu uita să te deconectezi. Eu am observat că o sesiune de 30 de minute de mers pe jos îmi revigorează mintea și mă ajută să găsesc soluții la problemele de cod.
În final, nu te descuraja dacă te simți copleșită. Majoritatea studenților trec prin aceleași „capcane” – diferența e cum le gestionăm. Dacă vrei să discutăm mai în detaliu despre seturile de date sau despre un plan de lucru specific, dă-mi un semn și îți trimit și eu câteva linkuri utile. Succes și ține‑te de plan! 🚀
Adelina:
Mulțumesc mult, Carina, pentru toate aceste ponturi super practice – parcă ai scos o listă de „to‑do” dintr-un ghid de supraviețuire a licenței! 🙏
După ce am citit mesajul tău, am început să îmi reorganizez puțin planul și am câteva gânduri/întrebări:
- Delimitarea subiectului – ideea de a mă concentra pe „detectarea anomaliilor în imagini de radiografie pulmonară cu CNN” mi se pare foarte tentantă, mai ales că am găsit deja câteva articole interesante pe această temă. Totuși, eu încă am câteva date de tip semnal ECG în mână, pe care le-am adunat în timpul unui stagiu de cercetare. Crezi că ar fi mai înțelept să rămân la imagini (pentru că există seturi publice ca NIH Chest X‑ray) sau să încerc să combin ambele tipuri de date? Am impresia că ar fi „cool” să aduc un twist multimodal, dar nu vreau să mă pierd din nou în complexitate.
- Verificarea datelor – am început să explorez MIMIC‑IV și, din câte am înțeles, accesul necesită un training de etică și aprobare de la IRB. E destul de descurajant pentru un proiect de licență cu deadline în câteva luni. Ai reușit vreodată să obții datele de la MIMIC fără să treci prin toată hârțogafia aia? Sau poate ai alte surse de imagini medicale (de ex. CheXpert, RSNA Pneumonia) care nu cer atâta formalitate?
- Sprint‑urile și Pomodoro – am încercat metoda Pomodoro în ultimele săptămâni, dar mi se pare că timpul de 25 de minute e prea scurt când lucrez la debugging de rețele neurale (îmi ia ore să înțeleg de ce modelul nu converge). Ai găsit tu un interval de timp care să funcționeze mai bine pentru sarcini de tip „deep learning” sau recomandi să păstăm Pomodoro doar pentru activități de lectură/documentare?
- Manager de referințe – încă nu m-am decis între Zotero și Mendeley. Am auzit că Zotero se integrează mai bine cu Chrome, dar Mendeley ar avea un UI mai curat. Ce ai folosit tu în mod constant în ultimul an și ce trucuri de organizare ai?
- Feedback de la profesor – am trimis deja un draft de plan de lucru, dar profesorul mi‑l a returnat cu un „mai multă claritate în obiective”. Cum îți structurezi tu un plan de lucru astfel încât să fie ușor de citit și să evidențieze clar pașii? Am încercat un tabel în Word, dar mi‑se pare cam „greu de parcurs”.
În plus, aș vrea să îți cer și un mic sfat legat de documentarea codului. Am început să scriu scripturi în Jupyter, dar nu știu cum să le transform într‑un repo curat pentru finalul lucrării (cu README, docstrings, etc.). Ai un workflow recomandat pentru a trece de la notebook la proiect final?
Orice feedback suplimentar e binevenit! Dacă ai și linkuri către template‑uri de raport de licență sau exemple de repo bine structurate, le-aș adora.
Mulțumesc încă o dată și abia aștept să continui discuția! 🚀
