Nasze projekty [mgr]

 • Agnieszka Sitko (2016-2017)
  Merge and Select: Visualization of a likelihood based k-sample adaptive fusing and model selection
  praca w formacie pdf
  Praca opisuje metodologię Merge and Select będącą alternatywą dla tradycyjnych testów post-hoc. Zadaniem algorytmów przedstawionych w pracy jest identyfikacja i wizualizacja hierarchicznej struktury zmiennych dyskretnych występujących w modelach statystycznych pozwalającej na zdefiniowanie jednoznaczego podziału zbioru. Implementacją Merge and Select jest pakiet języka R, factorMerger.
 • Magda Młynarczyk (2016-2017)
  Modele ryzyk konkurujących wraz z zastosowaniami w analizie chorych z nowotworami układu krwiotwórczego
  praca w formacie pdf
  Praca przedstawia opis biblioteki cr17 zajmującej sie estymowaniem modeli ryzyk konkurujących, ich wizualizacją oraz porównywaniem różnic w czasach przeżycia pomiędzy grupami. Przykład zastosowania został zaprezentowany na danych o pacjentach chorujących na nowotwory układu krwiotwórczego, poddanych terapii Azacytadyną.
 • Aleksandra Paluszyńska (2016-2017)
  Analiza struktury i ekstrakcja wiedzy z lasów losowych wraz z przykładami zastosowań dla danych The Cancer Genome Atlas
  praca w formacie pdf
  Praca opisuje pakiet randomForestExplainer, który analizuje i prezentuje strukturę lasu losowego. Wynikiem jest analiza ważności zmiennych, interakcji pomiędzy zmiennymi, zależności brzegowej pomiędzy zmiennymi niezależnymi a odpowiedziami modelu.
 • Katarzyna Sobiczewska (2015-2017)
  Analiza metod uczenia maszynowego wykorzystywanych w budowaniu sygnatur genetycznych
  praca w formacie pdf
  Tematyką pracy jest porównanie metod uczenia maszynowego, używanych do budowy sygnatur genetycznych. Praca przybliża konstrukcje algorytmiczne dwóch procedur klasyfikacji: regresji logistycznej jako przykład uogólnionego modelu liniowego oraz nieliniowego podejścia, którego przykładem są lasy losowe. W odniesieniu do regresji logistycznej omówiona została regularyzacja LASSO (L1). Opisane metody wykorzystano do analizy danych genomicznych. W prezentowanej analizie mierzymy się również z problemem niezrównoważonych klas oraz przeuczeniem modelu.
 • Monika Łapińska (2015-2016)
  Analiza algorytmów identyfikacji biomarkerów wraz z zastosowaniem do wielkoskalowych danych nowotworowych
  praca w formacie pdf
  Praca przedstawia analizę istniejących algorytmów identyfikacji sygnatur genowych oraz opis nowego, skuteczniejszego algorytmu do analizy dużych zbiorów danych. Opracowana sygnatura genowa wykorzystuje ekspresje poszczególnych genów oraz informacje o wzbogaceniu tych genów w konkretne funkcje – procesy biologiczne.
 • Barbara Sozańska (2015-2016)
  Porównanie statystycznych metod różnicowej analizy danych RNA-seq na przykładzie pakietów DeSeq i edgeR
  praca w formacie pdf
  Praca stanowi porównanie dwóch pakietów statystycznych – DESeq oraz edgeR — wykorzystywanych w różnicowej analizie ilości mRNA mierzonego wysokoprzepustowym sekwencjonowaniem RNA (RNA-Seq).
 • Lidia Chrabąszcz (2015-2016)
  Analiza algorytmów tworzenia oraz walidacji sygnatur genetycznych z przykładami zastosowań do danych z The Cancer Genome Atlas
  praca w formacie pdf
  Praca dyplomowa magisterska o tytule Analiza i walidacja algorytmów wyznaczania sygnatur genetycznych z przykładami zastosowań do danych z The Cancer Genome Atlas ma na celu stworzenie i przetestowanie algorytmu znajdowania charakterystycznych funkcji biologicznych dla danego zbioru pacjentów i genów. Zaproponowana w pracy metodologia została zaimplementowana w języku R i opublikowana w repozytorium Bioconductor w postaci pakietu GOpro.
 • Marcin Kosiński (2014-2015)
  Estymacja w modelu Coxa metodą stochastycznego spadku gradientu z przykładami zastosowań w analizie danych z The Cancer Genome Atlas
  praca w formacie pdf
  Praca przedstawia zastosowanie algorytmu numerycznej optymalizacji metodą stochastycznego spadku gradientu do wyznaczenia współczynników w modelu proporcjonalnych hazardów Coxa, opartych na analitycznej metodzie wyznaczania estymatorów metodą największej wiarogodności. Zaprezentowane podejście jest nowatorskie. W pracy przeprowadzono analizę, w trakcie której badano wpływ występowania mutacji w poszczególnych genach na czas przeżycia pacjentów, dla których dane kliniczne i dane o występowaniu mutacji zaczerpnięto z badania The Cancer Genome Atlas. Praca realizowana była w ramach współpracy z Wielkopolskim Centrum Onkologii.
 • Paulina Auguścik (2014-2015)
  Metody statystycznej identyfikacji zmian wariantów splicingowych wraz z przykładami zastosowań w analizie danych RNA-seq.
  praca w formacie pdf
  Praca poświęcona jest analizie zmian w udziale wariantów splicingowych. Opisano metody identyfikacji udziału wariantów splicingowych (algorytm casper, EM), przedyskutowano różne podejścia do testowania dwóch grup w sytuacji gdy dane nie są niezależne (test t, model mieszany, test sparowany z korektą), oraz zastosowano te metody i algorytmy do analizy rzeczywistych danych dotyczących palców krabowych (KRAB ZNF). Praca realizowana była w ramach współpracy z Wielkopolskim Centrum Onkologii.
 • Teresa Poniakowska (2011-2012)
  Sieci Bayesowskie i sieci (samo)wspierania, teoria i zastosowania do danych z systemu USOS
  praca w formacie pdf
  Praca przedstawia analizę danych historycznych systemu USOS Wydziału Matematyki, Informatyki i Mechaniki Uniwersytetu Warszawskiego w celu wyznaczenia kursów skupiających studentów o podobnych zainteresowaniach oraz znalezienia wśród kursów tych, które pozytywnie wpływają na pozostałe. Pierwszy problem zbadano przy użyciu sieci Bayesowskich, wykorzystując program R. Drugi problem zbadano przy użyciu własnej koncepcji sieci (samo)wspierania.
  Praca jest wykonywana w ramach większego projektu opracowania systemu rekomendacji kursów i wizualizacji procesu studiowania na podstawie bazy USOS.
 • Elżbieta Kłopotek (2011-2012)
  Właściwości algorytmów gradacyjnej analizy danych wraz z przykładowymi zastosowaniami w analizie danych z systemu USOS
  praca w formacie pdf
  Praca omawia wybrane algorytmy Gradacyjnej Analizy Danych (GAD), metody zaproponowanej i rozwijanej w Instytucie Podstaw Informatyki PAN. Prezentowane są właściwości wybranych algorytmów i kryjące się za nimi intuicje. W pracy również przedstawione są przykładowe zastosowania do analizy danych o ocenach \ studentów zebranych w systemie USOS.
  Praca jest wykonywana w ramach większego projektu opracowania systemu rekomendacji kursów i wizualizacji procesu studiowania na podstawie bazy USOS.
 • Karol Kański (2011-2012)
  Optymalizacja systemu rekomendacyjnego na podstawie bazy USOS
  praca w formacie pdf
  Praca przedstawia wprowadzenie do systemów rekomendacyjnych ze szczególnym uwzględnieniem systemów rekomendacyjnych opartych o sąsiedztwo oraz wykorzystywanych w nich algorytmów. Opisano m.in. algorytmy z rodziny najbliższych sąsiadów, algorytm slope one i metody rozkładu macierzy, w których nie wszystkie pola są określone. Oprócz teorii zaprezentowane są wyniki symulacji systemu rekomendacyjnego na danych pochodzących z bazy Uniwersyteckiego Systemu Obsługi Studiów (USOS).
  Praca jest wykonywana w ramach większego projektu opracowania systemu rekomendacji kursów i wizualizacji procesu studiowania na podstawie bazy USOS.
 • Kamil Bochacz (2010-)
  statystyka w finansach
  Modele szeregów czasowych w zastosowaniu do analizy danych sprzedażowych
  Praca dotyczy predykcji danych pochodzących ze sprzedaży jednej ze znanych marek odzieżowych. Główną opisywaną metodą będą szeregi czasowe. W pracy znajdzie się ich ścisły opis oraz przykład zastosowania dla danych, a następnie omówienie poprawności wyników oraz wyciągnięcie wniosków.
 • Zuzanna Branicka (2010-2011)
  Metody konstrukcji oraz symulacyjne badanie właściwości jednorodnych i niejednorodnych komitetów klasyfikatorów
  praca w formacie pdf
  kody zrodlowe w R
  Praca dotyczy badania właściwości komitetu klasyfikatorów zbudowanego z różnorodnych klasyfikatorów (drzewa klasyfikacyjne, liniowa dyskryminacja, metoda najbliższych sąsiadów). Zaproponowana metoda budowania klasyfikatora niejednorodnego jest porównywana z komitetami jednorodnymi i z metodą lasów losowych. Wykonane jest rozbudowane studium symulacyjne pozwalające na ocenę kiedy jakie komitety klasyfikatorów mają lepsze właściwości.
 • Aleksandra Maj (2010-2011)
  Wybor struktury i estymacja parametrow macierzy korelacji komponentów losowych w liniowym modelu z efektami losowymi
  praca w formacie pdf
  W pracy przedstawiona jest teoria dotycząca estymacji współczynników liniowych modeli z efektami mieszanymi, porównywania ich oraz testowania jakości dopasowania i doboru struktury komponentów losowych w modelu. Przedstawiony jest również szereg kryteriów mierzących jakość dopasowania modelu do danych: GIC, PRESS, CCC, R2. Oprocz teorii zaprezentowane są wyniki studium symulacyjnego, którego celem było zbadanie skuteczności wyboru struktur korelacji komponentów losowych modelu na podstawie opisanych kryteriow. Symulacje zostały przeprowadzone przy pakietu lmmfit, który powstał w ramach tej pracy.
 • Filip Grotkowski (2010-2011)
  USOS: System raportowania i analiz statystycznych
  praca w formacie pdf
  Praca dotyczy budowy modułu do systemu USOS umożliwiającego tworzenie raportów podsumowujących oceny studentów oraz zadowolenie studentów z podjętych wyborów. W ramach pracy zaprojektowano również zbiór metod podsumowujących zmiany w wynikach studentów na przestrzeni lat i w przekroju na rozmaite zmienne zależne.
 • Anna Lis (2010-2011)
  Uogólnione modele addytywne z parametrem położenia, skali i kształtu (Generalized additive models for location, scale and shape GAMLSS).
  praca w formacie pdf
  W pracy przedstawione są uogólnione modele addytywne z parametrem położenia, skali i kształtu. Opis matematyczny tych modeli uzupełniony będzie o opis funkcji programu R oraz o przykład zastosowania tych modeli do zbioru danych pediatrycznych.
  Dla ilustracji wyników wykorzystano dane ze współpracy z Instytutem Pomnik – Centrum Zdrowia Dziecka
 • Anna Zalewska (2009-2010)
  Ryzyko operacyjne: modelowanie, mierzenie i zabezpieczanie.
  praca w formacie pdf
  package description in english, pdf
  pakiet OpVaR do programu R, zip
  Niniejsza praca koncentruje się na metodach obliczania ryzyka operacyjnego z wykorzystaniem stworzonego pakietu opVaR napisanego jako biblioteka dla programu R. Przedstawione są liczne przykłady, ilustrujące rozwiązania zagadnień potrzebnych do obliczenia Value at Risk, m.in. problemu dopasowania rozkładów częstości i dotkliwości strat. Zwieńczeniem tych rozważań jest obliczenie wartości Value at Risk dla przykładowych danych.
 • Aleksandra Urbaniec (2009-2010)
  Analiza przeżycia, teoria i przykład zastosowania w badaniu długości życia pacjentek z rakiem piersi.
  praca w formacie pdf
  W pracy przedstawione jest wprowadzenie do analizy przeżycia, opis modeli, metody estymacji parametrów tych modeli oraz przykład zastosowania w medycynie. Praca składa się z części teoretycznej i praktycznej: przy użyciu danych rzeczywistych modelowana jest długość życia pacjentek z rakiem piersi. Ponadto zostały przeprowadzone symulacje badające własności niektórych testów i estymatorów w analizie przeżycia.
  W pracy przedstawiono wyniki analiz dla rzeczywistych danych pacjentek przebadanych w Dolnośląskim Centrum Onkologii.

Leave a Reply

Your email address will not be published. Required fields are marked *

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>