Git repozitar obsahuje 2 vetvy:
- Master
- Aktualna verzia skriptu.
- Master2
- Zaloha stareho kodu - obsahuje FTP klienta, ktory sa pripaja na databazu 1000 genomes. Tento pristup bol presunuty do zalohy, lebo data sa daju ziskat pohodlnejsim sposobom pomocou nastroja Ferret
Skript je napisany v jazyku Python 3.6. Obsahuje rozhranie pre spúšťanie rôznych štatistických testov. Momentálne sú naimplementované 2 druhy testov:
- Chi-squared test
- Permutačný test
- zpermutuje dáta a vykoná ľubovolný definovaný štatistický test
Pred samotnym spustenim je mozne stiahnut pozadovane data genov pouzitim nastroja Ferret.
Zlozka ./Ferret obsahuje data niekolkych genov, ktore je mozne pouzit ako vstup skriptu. Ako vstup sa vyuziva vzdy .ped
subor. V zlozke ./Ferret/Negative sa nachadzaju data pouzivane ako negativne kontroly.
Pre spustenie je potrebne mat nainstalovany aspon Python 3.6.
V terminaly je potrebne spustit:
cd PROJECT_ROOT_FOLDER/src/
python3 ./main.py -gene1=./Ferret/eIF4E1/eIF4E1.ped -gene2=./Ferret/eIF4G1/eIF4G1.ped
Pre Windows je mozne pouzit nastroj GitBash alebo klasicky Windows CMD
cd PROJECT_ROOT_FOLDER/src/
python ./main.py -gene1=./Ferret/eIF4E1/eIF4E1.ped -gene2=./Ferret/eIF4G1/eIF4G1.ped
Je mozne vyuzit PyCharm IDE, ktory pracuje priamo s Pythonem. Program je zadarmo pre studentov(mozno aj ucitelov).
File->Open
pre otvoreniePROJECT_ROOT_FOLDER
- V
Run->Edit Configurations
v castiScript parameters
sa nastavuju parametre vstupu- Napr.:
-gene1=../Ferret/eIF4E1/eIF4E1.ped -gene2=../Ferret/eIF4G1/eIF4G1.ped
- Napr.:
Run->Run...
Vystup sa vypisuje do zlozky PROJECT_ROOT_FOLDER/output/
.
Skript ma 3 druhy vystupu:
Gene_1.ped - Gene_2.ped.png
subor- Obsahuje tabulku s poctom pozitivnych/negativnych zhod a ich pomer pre jednotlive testy
- Obsahuje histogramy a best fit line pre jednotlive testy
- Vystup do kozole
- Obsahuje pocty pozitivnych/negativnych zhod a ich pomer
Gene_1.ped - Gene_2.ped.txt
subor- Obsahuje popis korelaci medzi stlpcami Genu 1 s Genom 2 a naopak.
V PROJECT_ROOT_FOLDER
je subor tests.sh
, ktory sluzi na automatizovane testovanie viacerych genov za sebou. Je mozne si upravit/dopisat vlastne testy. Hromadny vystup sa vypisuje jak do konzole tak do samostatneho suboru test.txt.
Skript je spustitelny cez:
- Linux/MAC OS: v termanili spustit
bash ./tests.sh
- Windows: v GitBash spustit
bash ./tests.sh
alebo len./tests.sh
-
python main.py -dataPath={path_to_data_folder} -fetch=True
- Priznak fetch spusti stahovanie dat do zlozky urcenej cestou v -dataPath
- V pripade ze priznak fetch je nastaveny na True, dojde k zmazaniu celej zlozky urcenej cestou v -dataPath
-
python main.py -dataPath={path_to_data_folder}
- Ak priznak -fetch nie je definovany, pouziju sa data v zlozke urcenej cestou -dataPath
- Data zostavaju zachovane, nic sa nemaze.
Pre vypocet multiple sequence alignment je potrebne mat nainstalovany program Clustalw2. Ten je potrebne umiestnit do zlozky src/clustalw pod nazvom clustalw
I don't trust atoms... I heard they make up everything.
This readme contains chemistry jokes, but you may not react