Extrait des données (147 x 3) sur 5 lignes et 3 colonnes
=========================================================
Assembly.Real Suggested.name Classification
1 GCF_003256445.1 Ralstonia_pseudosolanacearum|Bg07 Plant-associated
2 GCF_001855495.1 Ralstonia_pseudosolanacearum|CaRs-Mep Plant-associated
3 GCF_001644855.1 Ralstonia_pseudosolanacearum|CFBP3059 Plant-associated
4 GCF_000427195.1 Ralstonia_pseudosolanacearum|CMR15 Plant-associated
5 GCF_003256425.1 Ralstonia_pseudosolanacearum|Cq01 Plant-associated
[...]
Assembly.Real Suggested.name Classification
143 GCF_900461715.1 Ralstonia_mannitolilytica|NCTC12379 Human-associated
144 GCF_000954135.1 Ralstonia_mannitolilytica|SN82F48 Human-associated
145 GCF_001628775.1 Ralstonia_mannitolilytica|SN83A39 Human-associated
146 GCF_002939115.1 Ralstonia_mannitolilytica|WCHRM065694 Human-associated
147 GCF_002939145.1 Ralstonia_mannitolilytica|WCHRM065837 Human-associated
Extrait des données (147 x 134) sur 5 lignes et 5 colonnes
===========================================================
genome argannot...AGly.AadA1.pm.JQ690540.7968.8798.831 argannot...Bla.OXA.60.AY664505.1.816.816 argannot...Phe.CmlA1.M64556.601.1860.1260
1 GCF_000009125.1 0 0 0
2 GCF_000020205.1 0 1 0
3 GCF_000023425.1 0 1 0
4 GCF_000165085.1 0 1 0
5 GCF_000212635.3 0 0 0
argannot...Tet.TetC.EU751612.1.1191.1191
1 0
2 0
3 0
4 0
5 0
[...]
genome argannot...AGly.AadA1.pm.JQ690540.7968.8798.831 argannot...Bla.OXA.60.AY664505.1.816.816 argannot...Phe.CmlA1.M64556.601.1860.1260
143 GCF_900115545.1 0 1 0
144 GCF_900455575.1 0 0 0
145 GCF_900455685.1 0 0 0
146 GCF_900455835.1 0 1 0
147 GCF_900461715.1 0 0 0
argannot...Tet.TetC.EU751612.1.1191.1191
143 0
144 0
145 0
146 0
147 0
Extrait des données (147 x 17) sur 5 lignes et 5 colonnes
==========================================================
Genomes LAP NRPS NRPS.like T1PKS
1 GCF_000009125.1 0 3 0 1
2 GCF_000020205.1 0 0 0 1
3 GCF_000023425.1 0 0 0 0
4 GCF_000165085.1 0 0 0 1
5 GCF_000212635.3 0 2 1 2
[...]
Genomes LAP NRPS NRPS.like T1PKS
143 GCF_900115545.1 0 0 0 0
144 GCF_900455575.1 0 0 0 0
145 GCF_900455685.1 0 0 0 0
146 GCF_900455835.1 0 0 0 1
147 GCF_900461715.1 0 0 0 0
Extrait des données (12265 x 148) sur 5 lignes et 5 colonnes
=============================================================
kmers GCF_003256445.1 GCF_001855495.1 GCF_001644855.1 GCF_000427195.1
1 1695 0 0 0 0
2 2247 0 0 0 0
3 2643 0 0 0 0
4 4185 0 0 0 0
5 5523 0 0 0 0
[...]
kmers GCF_003256445.1 GCF_001855495.1 GCF_001644855.1 GCF_000427195.1
12261 4881081 0 0 0 0
12262 4881206 0 0 1 0
12263 4881666 0 0 0 0
12264 4882049 0 0 0 0
12265 4882883 0 0 0 0
+ ================================================================= +
+ +
+ # essai de renommage des genomes et stockage de la classification +
+ +
+ ================================================================= +
Human-associated Plant-associated
39 108
0 1
39 108
[1] "GCF_000009125.1" "GCF_000020205.1" "GCF_000023425.1" "GCF_000165085.1" "GCF_000212635.3" "GCF_000215325.1"
[1] "000009125" "000020205" "000023425" "000165085" "000212635" "000215325"
tous les 147 génomes de rpredi sont dans rclassi
Fusion de classification avec predipath OK
Extrait des données PREDIPATH df=rpredic (147 x 134) sur 5 lignes et 5 colonnes
===============================================================================
Classe argannot...AGly.AadA1.pm.JQ690540.7968.8798.831 argannot...Bla.OXA.60.AY664505.1.816.816 argannot...Phe.CmlA1.M64556.601.1860.1260
PLA_000009125 1 0 0 0
HUM_000020205 0 0 1 0
HUM_000023425 0 0 1 0
HUM_000165085 0 0 1 0
PLA_000212635 1 0 0 0
argannot...Tet.TetC.EU751612.1.1191.1191
PLA_000009125 0
HUM_000020205 0
HUM_000023425 0
HUM_000165085 0
PLA_000212635 0
[...]
Classe argannot...AGly.AadA1.pm.JQ690540.7968.8798.831 argannot...Bla.OXA.60.AY664505.1.816.816 argannot...Phe.CmlA1.M64556.601.1860.1260
HUM_900115545 0 0 1 0
HUM_900455575 0 0 0 0
HUM_900455685 0 0 0 0
HUM_900455835 0 0 1 0
HUM_900461715 0 0 0 0
argannot...Tet.TetC.EU751612.1.1191.1191
HUM_900115545 0
HUM_900455575 0
HUM_900455685 0
HUM_900455835 0
HUM_900461715 0
NOMS AVANT
[,1]
[1,] "Classe"
[2,] "argannot...AGly.AadA1.pm.JQ690540.7968.8798.831"
[3,] "argannot...Bla.OXA.60.AY664505.1.816.816"
[4,] "argannot...Phe.CmlA1.M64556.601.1860.1260"
[5,] "argannot...Tet.TetC.EU751612.1.1191.1191"
[6,] "card..gb.AAA74437.1.ARO.3000378.MexB"
[7,] "card..gb.AAN82549.1.ARO.3003369.Escherichia"
[8,] "card..gb.NP_459346.1.ARO.3000790.mdsB"
[9,] "card..gb.YP_208874.1.ARO.3003930.rpsJ"
[10,] "ncbi..gi.1331531451.ref.WP_102607461.1."
[11,] "ncbi..gi.446602081.ref.WP_000679427.1."
[12,] "ncbi..gi.638931161.ref.WP_024439378.1."
[13,] "ncbi..gi.771608516.ref.WP_045219469.1."
[14,] "vfdb_pre..VFG025402.gi.53723901."
[15,] "vfdb_pre..VFG026305.gi.83719377."
[16,] "vfdb_pre..VFG026325.gi.83720344."
...
[133,] "vfdb_pre..VFG042065.gi.17544760."
[134,] "vfdb_pre..VFG043206.gb.YP_001006774."
NOMS APRES
[,1]
[1,] "Classe"
[2,] "AGly.AadA1.pm.JQ690540.7968.8798.831"
[3,] "Bla.OXA.60.AY664505.1.816.816"
[4,] "Phe.CmlA1.M64556.601.1860.1260"
[5,] "Tet.TetC.EU751612.1.1191.1191"
[6,] "AAA74437.1.ARO.3000378.MexB"
[7,] "AAN82549.1.ARO.3003369.Escherichia"
[8,] "NP_459346.1.ARO.3000790.mdsB"
[9,] "YP_208874.1.ARO.3003930.rpsJ"
[10,] "1331531451.ref.WP_102607461.1."
[11,] "446602081.ref.WP_000679427.1."
[12,] "638931161.ref.WP_024439378.1."
[13,] "771608516.ref.WP_045219469.1."
[14,] "VFG025402.gi.53723901."
[15,] "VFG026305.gi.83719377."
[16,] "VFG026325.gi.83720344."
...
[133,] "VFG042065.gi.17544760."
[134,] "VFG043206.gb.YP_001006774."
tous les 147 génomes de ranti sont dans rclassi
Fusion de classification avec antismash OK
Extrait des données ANTISMASH df=rantic (147 x 17) sur 5 lignes et 5 colonnes
=============================================================================
Classe LAP NRPS NRPS.like T1PKS
PLA_000009125 1 0 3 0 1
HUM_000020205 0 0 0 0 1
HUM_000023425 0 0 0 0 0
HUM_000165085 0 0 0 0 1
PLA_000212635 1 0 2 1 2
[...]
Classe LAP NRPS NRPS.like T1PKS
HUM_900115545 0 0 0 0 0
HUM_900455575 0 0 0 0 0
HUM_900455685 0 0 0 0 0
HUM_900455835 0 0 0 0 1
HUM_900461715 0 0 0 0 0
tous les 147 génomes de rdbgwas sont dans rclassi
Extrait des données RDBGWAS original (12265 x 148) sur 5 lignes et 5 colonnes
=============================================================================
kmers 003256445 001855495 001644855 000427195
1 1695 0 0 0 0
2 2247 0 0 0 0
3 2643 0 0 0 0
4 4185 0 0 0 0
5 5523 0 0 0 0
[...]
kmers 003256445 001855495 001644855 000427195
12261 4881081 0 0 0 0
12262 4881206 0 0 1 0
12263 4881666 0 0 0 0
12264 4882049 0 0 0 0
12265 4882883 0 0 0 0
rdbgwas : 12265 x 148 sans NA : 12265 x 148
Fusion de classification avec dbgwas OK
Extrait des données DBGWAS df=rdbgwasc (147 x 12266) sur 5 lignes et 5 colonnes
===============================================================================
Classe 1695 2247 2643 4185
PLA_000009125 1 0 0 0 0
HUM_000020205 0 1 1 1 1
HUM_000023425 0 1 1 1 1
HUM_000165085 0 1 1 1 1
PLA_000212635 1 0 0 0 0
[...]
Classe 1695 2247 2643 4185
HUM_900115545 0 1 1 1 1
HUM_900455575 0 1 0 1 1
HUM_900455685 0 1 0 1 1
HUM_900455835 0 1 1 1 1
HUM_900461715 0 1 0 1 1
4879626 4879740 4880082 4880084 4880466 4880528 4881081 4881206 4881666 4882049 4882883
PLA_000009125 0 0 0 0 0 0 0 0 0 0 0
HUM_000020205 1 1 0 1 1 1 1 1 1 1 1
HUM_000023425 1 1 0 1 1 1 1 1 1 1 1
HUM_000165085 1 1 0 1 1 1 1 1 1 1 1
PLA_000212635 0 0 1 0 0 0 0 0 0 0 0
PLA_000215325 0 0 1 0 0 0 0 0 1 0 0
PLA_000223115 0 0 0 0 0 0 0 0 0 0 0
HUM_000227255 1 1 0 1 1 1 1 1 1 1 1
PLA_000283475 0 0 1 0 0 1 1 0 0 0 0
PLA_000348545 0 0 0 0 0 0 0 0 0 0 0
rdbgwasc : 147 x 12266 sans NA : 147 x 12266
+ =========================================================== +
+ +
+ Study of RALSTONIA data with PREDIPATHDB and CLASSIFICATION +
+ +
+ =========================================================== +
Rappel des modalités :
Human Associated Plant Associated
0 1
TRI A PLAT DE : Classe (ordre des modalités)
0 1 Total
Effectif 39 108 147
Cumul Effectif 39 147 147
Frequence (en %) 27 73 100
Cumul fréquences 27 100 100
Au départ, taille des données à traiter : 147 x 133
Recherche et supression des colonnes constantes
===============================================
il y a 7 colonnes constantes, à savoir
Column Const distinctVals keep/force value
2 AGly.AadA1.pm.JQ690540.7968.8798.831 Yes 1 0
4 Phe.CmlA1.M64556.601.1860.1260 Yes 1 0
5 Tet.TetC.EU751612.1.1191.1191 Yes 1 0
6 AAA74437.1.ARO.3000378.MexB Yes 1 0
11 446602081.ref.WP_000679427.1. Yes 1 0
12 638931161.ref.WP_024439378.1. Yes 1 0
134 VFG043206.gb.YP_001006774. Yes 1 0
Recherche et suppression de colonnes identiques ou opposées
===========================================================
il y a 14 colonnes redondantes, à savoir
Column
6 1331531451.ref.WP_102607461.1.
22 VFG040983.gi.17547834.
32 VFG041967.gi.17549694.
44 VFG041980.gi.17549243.
61 VFG041997.gi.17549086.
70 VFG042006.gi.17549077.
73 VFG042009.gi.17549074.
75 VFG042011.gi.17549076.
76 VFG042012.gi.17549071.
77 VFG042013.gi.17549072.
78 VFG042014.gi.17549070.
97 VFG042034.gi.17548249.
109 VFG042046.gi.17546820.
127 VFG042065.gi.17544760.
nombre de colonnes au début : 127
nombre de colonnes redondantes : 14
nombre de colonnes en fin : 113
Column Equal Opposite
1 Classe 1331531451.ref.WP_102607461.1.
2 Bla.OXA.60.AY664505.1.816.816
3 AAN82549.1.ARO.3003369.Escherichia
4 NP_459346.1.ARO.3000790.mdsB
5 YP_208874.1.ARO.3003930.rpsJ
7 771608516.ref.WP_045219469.1.
8 VFG025402.gi.53723901.
9 VFG026305.gi.83719377.
10 VFG026325.gi.83720344.
11 VFG040972.gi.17547832.
12 VFG040973.gi.17547833.
13 VFG040974.gi.17547831.
14 VFG040975.gi.17547830.
15 VFG040976.gi.17547829.
16 VFG040977.gi.17547828.
17 VFG040978.gi.17547827. VFG040983.gi.17547834.
18 VFG040979.gi.17547825.
19 VFG040980.gi.17547826.
20 VFG040981.gi.17547824.
21 VFG040982.gi.17547546.
23 VFG040984.gi.17547835.
24 VFG041115.gi.53717514. VFG041967.gi.17549694. VFG041980.gi.17549243. VFG042034.gi.17548249.
25 VFG041146.gi.206558747.
26 VFG041147.gi.206558748.
27 VFG041203.gi.283786439.
28 VFG041204.gi.283786440.
29 VFG041928.gi.21231996.
30 VFG041965.gi.17549801.
31 VFG041966.gi.17549820.
33 VFG041968.gi.17549679.
34 VFG041969.gi.17549607.
35 VFG041970.gi.17549603.
36 VFG041971.gi.17549593.
37 VFG041972.gi.17549500.
38 VFG041974.gi.17549351.
39 VFG041975.gi.17549433.
40 VFG041976.gi.17549457.
41 VFG041977.gi.17549460.
42 VFG041978.gi.17549252.
43 VFG041979.gi.17549245.
45 VFG041981.gi.17549135.
46 VFG041982.gi.17549124.
47 VFG041983.gi.17549106.
48 VFG041984.gi.17549103. VFG041997.gi.17549086. VFG042006.gi.17549077. VFG042011.gi.17549076.
49 VFG041985.gi.17549100.
50 VFG041986.gi.17549098.
51 VFG041987.gi.17549097.
52 VFG041988.gi.17549096.
53 VFG041989.gi.17549095.
54 VFG041990.gi.17549094.
55 VFG041991.gi.17549093.
56 VFG041992.gi.17549092. VFG042012.gi.17549071. VFG042013.gi.17549072.
57 VFG041993.gi.17549091.
58 VFG041994.gi.17549090.
59 VFG041995.gi.17549089.
60 VFG041996.gi.17549088.
62 VFG041998.gi.17549087.
63 VFG041999.gi.17549085.
64 VFG042000.gi.17549083.
65 VFG042001.gi.17549084.
66 VFG042002.gi.17549081. VFG042009.gi.17549074. VFG042014.gi.17549070.
67 VFG042003.gi.17549082.
68 VFG042004.gi.17549080.
69 VFG042005.gi.17549079.
71 VFG042007.gi.17549078.
72 VFG042008.gi.17549073.
74 VFG042010.gi.17549075.
79 VFG042015.gi.17549068.
80 VFG042016.gi.17549067.
81 VFG042017.gi.17549066.
82 VFG042018.gi.17549043.
83 VFG042019.gi.17548952.
84 VFG042020.gi.17548944.
85 VFG042021.gi.17548893.
86 VFG042022.gi.17548793.
87 VFG042023.gi.17548544.
88 VFG042024.gi.17548525.
89 VFG042025.gi.17548517.
90 VFG042026.gi.17548439.
91 VFG042027.gi.17548436.
92 VFG042028.gi.17548437.
93 VFG042029.gi.17548434.
94 VFG042030.gi.17548414.
95 VFG042032.gi.17548381.
96 VFG042033.gi.17548320.
98 VFG042035.gi.17548118.
99 VFG042036.gi.17548086.
100 VFG042037.gi.17547989.
101 VFG042038.gi.17548007.
102 VFG042039.gi.17547931.
103 VFG042040.gi.17547893.
104 VFG042041.gi.17547494.
105 VFG042042.gi.17547078.
106 VFG042043.gi.17546858.
107 VFG042044.gi.17546851.
108 VFG042045.gi.17546849. VFG042046.gi.17546820.
110 VFG042047.gi.17546558.
111 VFG042048.gi.17546534.
112 VFG042049.gi.17546520.
113 VFG042050.gi.17546442.
114 VFG042051.gi.17546519.
115 VFG042052.gi.17546194.
116 VFG042053.gi.17546105.
117 VFG042054.gi.17546076.
118 VFG042055.gi.17546075.
119 VFG042057.gi.17546068.
120 VFG042058.gi.17545587.
121 VFG042059.gi.17545327.
122 VFG042060.gi.17545543.
123 VFG042061.gi.17545545.
124 VFG042062.gi.17545040.
125 VFG042063.gi.17544976.
126 VFG042064.gi.17544964.
on rajoute a posteriori les colonnes
=====================================
1331531451.ref.WP_102607461.1.
on remet la colonne 1331531451.ref.WP_102607461.1.
Utilisation de nearZeroVariance()
=================================
Essai de détection de lignes égales et contradictions
=====================================================
Extrait des données (147 x 95) sur 5 lignes et 5 colonnes
==========================================================
Classe Bla.OXA.60.AY664505.1.816.816 AAN82549.1.ARO.3003369.Escherichia 771608516.ref.WP_045219469.1. VFG025402.gi.53723901.
PLA_000009125 1 0 1 0 1
HUM_000020205 0 1 1 0 0
HUM_000023425 0 1 1 0 0
HUM_000165085 0 1 1 0 0
PLA_000212635 1 0 0 0 0
[...]
Classe Bla.OXA.60.AY664505.1.816.816 AAN82549.1.ARO.3003369.Escherichia 771608516.ref.WP_045219469.1. VFG025402.gi.53723901.
HUM_900115545 0 1 0 0 0
HUM_900455575 0 0 1 1 0
HUM_900455685 0 0 1 1 0
HUM_900455835 0 1 1 0 0
HUM_900461715 0 0 1 1 0
33 lines removed
Line Equals
1 PLA_000009125
2 HUM_000020205 64
3 HUM_000023425 17 134
4 HUM_000165085 23 47 146
5 PLA_000212635
6 PLA_000215325
7 PLA_000223115
8 HUM_000227255 142
9 PLA_000283475
10 PLA_000348545
11 HUM_000372665
12 PLA_000427195
13 PLA_000430925
14 HUM_000442475 37 46 57
15 PLA_000525615
16 HUM_000607165
18 HUM_000620465
19 PLA_000671315
20 PLA_000671335
21 PLA_000710135 39 60 61 62 76 77 78 85 93 94 95
22 PLA_000710695
24 PLA_000749995
25 PLA_000750575
26 PLA_000750585
27 HUM_000801955
28 PLA_000825785
29 PLA_000825805
30 PLA_000825825
31 PLA_000825845
32 PLA_000825885
33 PLA_000825925
34 HUM_000953875 89 98 145 147
35 HUM_000954135
36 PLA_001050995
38 HUM_001078575
40 PLA_001373255
41 PLA_001373275
42 PLA_001373295
43 PLA_001373315
44 PLA_001373335
45 PLA_001484095 133
48 PLA_001586135 119 121
49 PLA_001587135
50 PLA_001587155
51 HUM_001628775
52 PLA_001644795
53 PLA_001644805
54 PLA_001644855
55 PLA_001644865
56 PLA_001645725
58 PLA_001663415
59 HUM_001663855 97
63 HUM_001699795
65 PLA_001708525
66 PLA_001854265
67 PLA_001855495
68 PLA_001870805
69 PLA_001870825
70 PLA_001876975
71 PLA_001876985
72 PLA_001879565
73 PLA_001887535
74 PLA_001891105
75 PLA_001901665
79 PLA_002155245
80 PLA_002162015
81 PLA_002220465
82 PLA_002251655
83 PLA_002251695
84 HUM_002393485 99
86 HUM_002516395
87 PLA_002549815
88 HUM_002849525
90 PLA_002894285
91 PLA_002894765
92 PLA_002894775
96 PLA_002930085
100 HUM_002939165
101 HUM_003096975
102 PLA_003256405
103 PLA_003256425
104 PLA_003256445
105 HUM_003290055
106 PLA_003337165
107 PLA_003515145 108
109 PLA_003515185 113
110 PLA_003515205
111 PLA_003515225
112 PLA_003515245
114 PLA_003515285
115 PLA_003515345
116 PLA_003515365
117 PLA_003515405
118 PLA_003515425
120 PLA_003515485
122 PLA_003515525
123 PLA_003515545
124 PLA_003515565
125 PLA_003515585 126
127 PLA_003515625
128 PLA_003576005
129 PLA_003576625
130 PLA_003595305
131 PLA_003595325
132 PLA_003612975
135 PLA_003860665
136 PLA_003860685
137 PLA_003860705
138 PLA_003860725
139 PLA_003860745
140 PLA_003860765
141 PLA_003999715
143 HUM_900115545
144 HUM_900455575
Classes and contradictions between classes
==========================================
Line Class Equal.Lines Contradictions Classes
[1,] PLA_000009125 1 1 FALSE 1
[2,] HUM_000020205 0 2 FALSE 0 0
[3,] HUM_000023425 0 3 FALSE 0 0 0
[4,] HUM_000165085 0 4 FALSE 0 0 0 0
[5,] PLA_000212635 1 1 FALSE 1
[6,] PLA_000215325 1 1 FALSE 1
[7,] PLA_000223115 1 1 FALSE 1
[8,] HUM_000227255 0 2 FALSE 0 0
[9,] PLA_000283475 1 1 FALSE 1
[10,] PLA_000348545 1 1 FALSE 1
[11,] HUM_000372665 0 1 FALSE 0
[12,] PLA_000427195 1 1 FALSE 1
[13,] PLA_000430925 1 1 FALSE 1
[14,] HUM_000442475 0 4 FALSE 0 0 0 0
[15,] PLA_000525615 1 1 FALSE 1
[16,] HUM_000607165 0 1 FALSE 0
[17,] HUM_000620465 0 1 FALSE 0
[18,] PLA_000671315 1 1 FALSE 1
[19,] PLA_000671335 1 1 FALSE 1
[20,] PLA_000710135 1 12 FALSE 1 1 1 1 1 1 1 1 1 1 1 1
[21,] PLA_000710695 1 1 FALSE 1
[22,] PLA_000749995 1 1 FALSE 1
[23,] PLA_000750575 1 1 FALSE 1
[24,] PLA_000750585 1 1 FALSE 1
[25,] HUM_000801955 0 1 FALSE 0
[26,] PLA_000825785 1 1 FALSE 1
[27,] PLA_000825805 1 1 FALSE 1
[28,] PLA_000825825 1 1 FALSE 1
[29,] PLA_000825845 1 1 FALSE 1
[30,] PLA_000825885 1 1 FALSE 1
[31,] PLA_000825925 1 1 FALSE 1
[32,] HUM_000953875 0 5 FALSE 0 0 0 0 0
[33,] HUM_000954135 0 1 FALSE 0
[34,] PLA_001050995 1 1 FALSE 1
[35,] HUM_001078575 0 1 FALSE 0
[36,] PLA_001373255 1 1 FALSE 1
[37,] PLA_001373275 1 1 FALSE 1
[38,] PLA_001373295 1 1 FALSE 1
[39,] PLA_001373315 1 1 FALSE 1
[40,] PLA_001373335 1 1 FALSE 1
[41,] PLA_001484095 1 2 FALSE 1 1
[42,] PLA_001586135 1 3 FALSE 1 1 1
[43,] PLA_001587135 1 1 FALSE 1
[44,] PLA_001587155 1 1 FALSE 1
[45,] HUM_001628775 0 1 FALSE 0
[46,] PLA_001644795 1 1 FALSE 1
[47,] PLA_001644805 1 1 FALSE 1
[48,] PLA_001644855 1 1 FALSE 1
[49,] PLA_001644865 1 1 FALSE 1
[50,] PLA_001645725 1 1 FALSE 1
[51,] PLA_001663415 1 1 FALSE 1
[52,] HUM_001663855 0 2 FALSE 0 0
[53,] HUM_001699795 0 1 FALSE 0
[54,] PLA_001708525 1 1 FALSE 1
[55,] PLA_001854265 1 1 FALSE 1
[56,] PLA_001855495 1 1 FALSE 1
[57,] PLA_001870805 1 1 FALSE 1
[58,] PLA_001870825 1 1 FALSE 1
[59,] PLA_001876975 1 1 FALSE 1
[60,] PLA_001876985 1 1 FALSE 1
[61,] PLA_001879565 1 1 FALSE 1
[62,] PLA_001887535 1 1 FALSE 1
[63,] PLA_001891105 1 1 FALSE 1
[64,] PLA_001901665 1 1 FALSE 1
[65,] PLA_002155245 1 1 FALSE 1
[66,] PLA_002162015 1 1 FALSE 1
[67,] PLA_002220465 1 1 FALSE 1
[68,] PLA_002251655 1 1 FALSE 1
[69,] PLA_002251695 1 1 FALSE 1
[70,] HUM_002393485 0 2 FALSE 0 0
[71,] HUM_002516395 0 1 FALSE 0
[72,] PLA_002549815 1 1 FALSE 1
[73,] HUM_002849525 0 1 FALSE 0
[74,] PLA_002894285 1 1 FALSE 1
[75,] PLA_002894765 1 1 FALSE 1
[76,] PLA_002894775 1 1 FALSE 1
[77,] PLA_002930085 1 1 FALSE 1
[78,] HUM_002939165 0 1 FALSE 0
[79,] HUM_003096975 0 1 FALSE 0
[80,] PLA_003256405 1 1 FALSE 1
[81,] PLA_003256425 1 1 FALSE 1
[82,] PLA_003256445 1 1 FALSE 1
[83,] HUM_003290055 0 1 FALSE 0
[84,] PLA_003337165 1 1 FALSE 1
[85,] PLA_003515145 1 2 FALSE 1 1
[86,] PLA_003515185 1 2 FALSE 1 1
[87,] PLA_003515205 1 1 FALSE 1
[88,] PLA_003515225 1 1 FALSE 1
[89,] PLA_003515245 1 1 FALSE 1
[90,] PLA_003515285 1 1 FALSE 1
[91,] PLA_003515345 1 1 FALSE 1
[92,] PLA_003515365 1 1 FALSE 1
[93,] PLA_003515405 1 1 FALSE 1
[94,] PLA_003515425 1 1 FALSE 1
[95,] PLA_003515485 1 1 FALSE 1
[96,] PLA_003515525 1 1 FALSE 1
[97,] PLA_003515545 1 1 FALSE 1
[98,] PLA_003515565 1 1 FALSE 1
[99,] PLA_003515585 1 2 FALSE 1 1
[100,] PLA_003515625 1 1 FALSE 1
[101,] PLA_003576005 1 1 FALSE 1
[102,] PLA_003576625 1 1 FALSE 1
[103,] PLA_003595305 1 1 FALSE 1
[104,] PLA_003595325 1 1 FALSE 1
[105,] PLA_003612975 1 1 FALSE 1
[106,] PLA_003860665 1 1 FALSE 1
[107,] PLA_003860685 1 1 FALSE 1
[108,] PLA_003860705 1 1 FALSE 1
[109,] PLA_003860725 1 1 FALSE 1
[110,] PLA_003860745 1 1 FALSE 1
[111,] PLA_003860765 1 1 FALSE 1
[112,] PLA_003999715 1 1 FALSE 1
[113,] HUM_900115545 0 1 FALSE 0
[114,] HUM_900455575 0 1 FALSE 0
Traitement dimensionsDeb dimensionsFin
1 Colonnes constantes 147 x 133 147 x 126
2 Colonnes identiques ou opposées 147 x 126 147 x 112
3 Ajout_a_posteriori 147 x 112 147 x 113
4 Colonnes de faible variance 147 x 113 147 x 94
5 Lignes égales 147 x 94 114 x 94
Au final, taille des données à traiter : 114 x 95
Extrait des données données restantes (114 x 95) sur 5 lignes et 5 colonnes
===========================================================================
Classe Bla.OXA.60.AY664505.1.816.816 AAN82549.1.ARO.3003369.Escherichia 771608516.ref.WP_045219469.1. VFG025402.gi.53723901.
PLA_000009125 1 0 1 0 1
HUM_000020205 0 1 1 0 0
HUM_000023425 0 1 1 0 0
HUM_000165085 0 1 1 0 0
PLA_000212635 1 0 0 0 0
[...]
Classe Bla.OXA.60.AY664505.1.816.816 AAN82549.1.ARO.3003369.Escherichia 771608516.ref.WP_045219469.1. VFG025402.gi.53723901.
PLA_003860745 1 0 1 0 0
PLA_003860765 1 0 1 0 0
PLA_003999715 1 0 1 0 0
HUM_900115545 0 1 0 0 0
HUM_900455575 0 0 1 1 0
Recherche de colonnes spécifiques de la classe, seuil 85 %
===========================================================
Rappel des effectifs par classe pour les 114 lignes de données:
0 1
23 91
Column sum sep1 sum0 pct0 spec0 nearly0 sep2 sum1 pct1 spec1 nearly1 sep3
1 Bla.OXA.60.AY664505.1.816.816 14 | 14 60.87 % | 0 0 % |
2 AAN82549.1.ARO.3003369.Escherichia 95 | 13 56.52 % | 82 90.11 % YYY |
3 771608516.ref.WP_045219469.1. 9 | 9 39.13 % | 0 0 % |
4 VFG025402.gi.53723901. 25 | 0 0 % | 25 27.47 % |
5 VFG026305.gi.83719377. 6 | 6 26.09 % | 0 0 % |
6 VFG026325.gi.83720344. 7 | 6 26.09 % | 1 1.1 % |
7 VFG040972.gi.17547832. 88 | 0 0 % | 88 96.7 % YYY |
8 VFG040973.gi.17547833. 106 | 22 95.65 % XXX | 84 92.31 % YYY |
9 VFG040975.gi.17547830. 84 | 0 0 % | 84 92.31 % YYY |
10 VFG040976.gi.17547829. 103 | 17 73.91 % | 86 94.51 % YYY |
11 VFG040981.gi.17547824. 74 | 1 4.35 % | 73 80.22 % |
12 VFG041115.gi.53717514. 46 | 0 0 % | 46 50.55 % |
13 VFG041146.gi.206558747. 45 | 3 13.04 % | 42 46.15 % |
14 VFG041147.gi.206558748. 96 | 17 73.91 % | 79 86.81 % YYY |
15 VFG041965.gi.17549801. 52 | 0 0 % | 52 57.14 % |
16 VFG041966.gi.17549820. 43 | 0 0 % | 43 47.25 % |
17 VFG041968.gi.17549679. 37 | 0 0 % | 37 40.66 % |
18 VFG041969.gi.17549607. 41 | 0 0 % | 41 45.05 % |
19 VFG041970.gi.17549603. 51 | 0 0 % | 51 56.04 % |
20 VFG041971.gi.17549593. 40 | 0 0 % | 40 43.96 % |
21 VFG041972.gi.17549500. 58 | 0 0 % | 58 63.74 % |
22 VFG041974.gi.17549351. 41 | 0 0 % | 41 45.05 % |
23 VFG041976.gi.17549457. 37 | 0 0 % | 37 40.66 % |
24 VFG041977.gi.17549460. 33 | 0 0 % | 33 36.26 % |
25 VFG041978.gi.17549252. 42 | 0 0 % | 42 46.15 % |
26 VFG041979.gi.17549245. 50 | 0 0 % | 50 54.95 % |
27 VFG041981.gi.17549135. 35 | 0 0 % | 35 38.46 % |
28 VFG041983.gi.17549106. 42 | 0 0 % | 42 46.15 % |
29 VFG041984.gi.17549103. 86 | 0 0 % | 86 94.51 % YYY |
30 VFG041985.gi.17549100. 39 | 0 0 % | 39 42.86 % |
31 VFG041986.gi.17549098. 42 | 0 0 % | 42 46.15 % |
32 VFG041987.gi.17549097. 44 | 0 0 % | 44 48.35 % |
33 VFG041988.gi.17549096. 22 | 0 0 % | 22 24.18 % |
34 VFG041989.gi.17549095. 81 | 0 0 % | 81 89.01 % YYY |
35 VFG041990.gi.17549094. 92 | 7 30.43 % | 85 93.41 % YYY |
36 VFG041991.gi.17549093. 85 | 0 0 % | 85 93.41 % YYY |
37 VFG041992.gi.17549092. 87 | 0 0 % | 87 95.6 % YYY |
38 VFG041993.gi.17549091. 88 | 7 30.43 % | 81 89.01 % YYY |
39 VFG041994.gi.17549090. 42 | 0 0 % | 42 46.15 % |
40 VFG041995.gi.17549089. 81 | 0 0 % | 81 89.01 % YYY |
41 VFG041996.gi.17549088. 86 | 0 0 % | 86 94.51 % YYY |
42 VFG041998.gi.17549087. 82 | 0 0 % | 82 90.11 % YYY |
43 VFG041999.gi.17549085. 89 | 1 4.35 % | 88 96.7 % YYY |
44 VFG042000.gi.17549083. 78 | 0 0 % | 78 85.71 % YYY |
45 VFG042001.gi.17549084. 92 | 7 30.43 % | 85 93.41 % YYY |
46 VFG042002.gi.17549081. 94 | 7 30.43 % | 87 95.6 % YYY |
47 VFG042003.gi.17549082. 82 | 0 0 % | 82 90.11 % YYY |
48 VFG042004.gi.17549080. 93 | 7 30.43 % | 86 94.51 % YYY |
49 VFG042005.gi.17549079. 52 | 0 0 % | 52 57.14 % |
50 VFG042007.gi.17549078. 82 | 0 0 % | 82 90.11 % YYY |
51 VFG042008.gi.17549073. 95 | 8 34.78 % | 87 95.6 % YYY |
52 VFG042010.gi.17549075. 50 | 0 0 % | 50 54.95 % |
53 VFG042015.gi.17549068. 42 | 0 0 % | 42 46.15 % |
54 VFG042016.gi.17549067. 44 | 0 0 % | 44 48.35 % |
55 VFG042017.gi.17549066. 45 | 0 0 % | 45 49.45 % |
56 VFG042018.gi.17549043. 44 | 0 0 % | 44 48.35 % |
57 VFG042019.gi.17548952. 50 | 0 0 % | 50 54.95 % |
58 VFG042021.gi.17548893. 45 | 0 0 % | 45 49.45 % |
59 VFG042022.gi.17548793. 26 | 0 0 % | 26 28.57 % |
60 VFG042023.gi.17548544. 75 | 0 0 % | 75 82.42 % |
61 VFG042024.gi.17548525. 49 | 0 0 % | 49 53.85 % |
62 VFG042025.gi.17548517. 43 | 0 0 % | 43 47.25 % |
63 VFG042027.gi.17548436. 41 | 0 0 % | 41 45.05 % |
64 VFG042028.gi.17548437. 39 | 0 0 % | 39 42.86 % |
65 VFG042030.gi.17548414. 38 | 0 0 % | 38 41.76 % |
66 VFG042032.gi.17548381. 45 | 0 0 % | 45 49.45 % |
67 VFG042033.gi.17548320. 45 | 0 0 % | 45 49.45 % |
68 VFG042035.gi.17548118. 55 | 0 0 % | 55 60.44 % |
69 VFG042036.gi.17548086. 79 | 0 0 % | 79 86.81 % YYY |
70 VFG042037.gi.17547989. 52 | 0 0 % | 52 57.14 % |
71 VFG042038.gi.17548007. 24 | 0 0 % | 24 26.37 % |
72 VFG042039.gi.17547931. 28 | 0 0 % | 28 30.77 % |
73 VFG042040.gi.17547893. 16 | 0 0 % | 16 17.58 % |
74 VFG042041.gi.17547494. 45 | 0 0 % | 45 49.45 % |
75 VFG042042.gi.17547078. 43 | 0 0 % | 43 47.25 % |
76 VFG042043.gi.17546858. 41 | 0 0 % | 41 45.05 % |
77 VFG042044.gi.17546851. 38 | 0 0 % | 38 41.76 % |
78 VFG042045.gi.17546849. 43 | 0 0 % | 43 47.25 % |
79 VFG042047.gi.17546558. 42 | 0 0 % | 42 46.15 % |
80 VFG042048.gi.17546534. 22 | 0 0 % | 22 24.18 % |
81 VFG042049.gi.17546520. 42 | 0 0 % | 42 46.15 % |
82 VFG042051.gi.17546519. 42 | 0 0 % | 42 46.15 % |
83 VFG042052.gi.17546194. 48 | 0 0 % | 48 52.75 % |
84 VFG042053.gi.17546105. 41 | 0 0 % | 41 45.05 % |
85 VFG042054.gi.17546076. 32 | 0 0 % | 32 35.16 % |
86 VFG042055.gi.17546075. 44 | 0 0 % | 44 48.35 % |
87 VFG042057.gi.17546068. 34 | 0 0 % | 34 37.36 % |
88 VFG042058.gi.17545587. 41 | 0 0 % | 41 45.05 % |
89 VFG042060.gi.17545543. 46 | 0 0 % | 46 50.55 % |
90 VFG042061.gi.17545545. 29 | 0 0 % | 29 31.87 % |
91 VFG042062.gi.17545040. 34 | 0 0 % | 34 37.36 % |
92 VFG042063.gi.17544976. 18 | 0 0 % | 18 19.78 % |
93 VFG042064.gi.17544964. 41 | 0 0 % | 41 45.05 % |
94 1331531451.ref.WP_102607461.1. 23 | 23 100 % OUI XXX | 0 0 % |
Affichage par meilleure différence de pourcentages
==================================================
Column sum sep1 sum0 pct0 spec0 nearly0 sep2 sum1 pct1 spec1 nearly1 sep3
7 VFG040972.gi.17547832. 88 | 0 0 % | 88 96.7 % YYY |
43 VFG041999.gi.17549085. 89 | 1 4.35 % | 88 96.7 % YYY |
37 VFG041992.gi.17549092. 87 | 0 0 % | 87 95.6 % YYY |
46 VFG042002.gi.17549081. 94 | 7 30.43 % | 87 95.6 % YYY |
51 VFG042008.gi.17549073. 95 | 8 34.78 % | 87 95.6 % YYY |
29 VFG041984.gi.17549103. 86 | 0 0 % | 86 94.51 % YYY |
41 VFG041996.gi.17549088. 86 | 0 0 % | 86 94.51 % YYY |
48 VFG042004.gi.17549080. 93 | 7 30.43 % | 86 94.51 % YYY |
10 VFG040976.gi.17547829. 103 | 17 73.91 % | 86 94.51 % YYY |
36 VFG041991.gi.17549093. 85 | 0 0 % | 85 93.41 % YYY |
35 VFG041990.gi.17549094. 92 | 7 30.43 % | 85 93.41 % YYY |
45 VFG042001.gi.17549084. 92 | 7 30.43 % | 85 93.41 % YYY |
9 VFG040975.gi.17547830. 84 | 0 0 % | 84 92.31 % YYY |
8 VFG040973.gi.17547833. 106 | 22 95.65 % XXX | 84 92.31 % YYY |
42 VFG041998.gi.17549087. 82 | 0 0 % | 82 90.11 % YYY |
47 VFG042003.gi.17549082. 82 | 0 0 % | 82 90.11 % YYY |
50 VFG042007.gi.17549078. 82 | 0 0 % | 82 90.11 % YYY |
2 AAN82549.1.ARO.3003369.Escherichia 95 | 13 56.52 % | 82 90.11 % YYY |
34 VFG041989.gi.17549095. 81 | 0 0 % | 81 89.01 % YYY |
40 VFG041995.gi.17549089. 81 | 0 0 % | 81 89.01 % YYY |
38 VFG041993.gi.17549091. 88 | 7 30.43 % | 81 89.01 % YYY |
69 VFG042036.gi.17548086. 79 | 0 0 % | 79 86.81 % YYY |
14 VFG041147.gi.206558748. 96 | 17 73.91 % | 79 86.81 % YYY |
44 VFG042000.gi.17549083. 78 | 0 0 % | 78 85.71 % YYY |
60 VFG042023.gi.17548544. 75 | 0 0 % | 75 82.42 % |
11 VFG040981.gi.17547824. 74 | 1 4.35 % | 73 80.22 % |
21 VFG041972.gi.17549500. 58 | 0 0 % | 58 63.74 % |
68 VFG042035.gi.17548118. 55 | 0 0 % | 55 60.44 % |
15 VFG041965.gi.17549801. 52 | 0 0 % | 52 57.14 % |
49 VFG042005.gi.17549079. 52 | 0 0 % | 52 57.14 % |
70 VFG042037.gi.17547989. 52 | 0 0 % | 52 57.14 % |
19 VFG041970.gi.17549603. 51 | 0 0 % | 51 56.04 % |
26 VFG041979.gi.17549245. 50 | 0 0 % | 50 54.95 % |
52 VFG042010.gi.17549075. 50 | 0 0 % | 50 54.95 % |
57 VFG042019.gi.17548952. 50 | 0 0 % | 50 54.95 % |
61 VFG042024.gi.17548525. 49 | 0 0 % | 49 53.85 % |
83 VFG042052.gi.17546194. 48 | 0 0 % | 48 52.75 % |
12 VFG041115.gi.53717514. 46 | 0 0 % | 46 50.55 % |
89 VFG042060.gi.17545543. 46 | 0 0 % | 46 50.55 % |
55 VFG042017.gi.17549066. 45 | 0 0 % | 45 49.45 % |
58 VFG042021.gi.17548893. 45 | 0 0 % | 45 49.45 % |
66 VFG042032.gi.17548381. 45 | 0 0 % | 45 49.45 % |
67 VFG042033.gi.17548320. 45 | 0 0 % | 45 49.45 % |
74 VFG042041.gi.17547494. 45 | 0 0 % | 45 49.45 % |
32 VFG041987.gi.17549097. 44 | 0 0 % | 44 48.35 % |
54 VFG042016.gi.17549067. 44 | 0 0 % | 44 48.35 % |
56 VFG042018.gi.17549043. 44 | 0 0 % | 44 48.35 % |
86 VFG042055.gi.17546075. 44 | 0 0 % | 44 48.35 % |
16 VFG041966.gi.17549820. 43 | 0 0 % | 43 47.25 % |
62 VFG042025.gi.17548517. 43 | 0 0 % | 43 47.25 % |
75 VFG042042.gi.17547078. 43 | 0 0 % | 43 47.25 % |
78 VFG042045.gi.17546849. 43 | 0 0 % | 43 47.25 % |
25 VFG041978.gi.17549252. 42 | 0 0 % | 42 46.15 % |
28 VFG041983.gi.17549106. 42 | 0 0 % | 42 46.15 % |
31 VFG041986.gi.17549098. 42 | 0 0 % | 42 46.15 % |
39 VFG041994.gi.17549090. 42 | 0 0 % | 42 46.15 % |
53 VFG042015.gi.17549068. 42 | 0 0 % | 42 46.15 % |
79 VFG042047.gi.17546558. 42 | 0 0 % | 42 46.15 % |
81 VFG042049.gi.17546520. 42 | 0 0 % | 42 46.15 % |
82 VFG042051.gi.17546519. 42 | 0 0 % | 42 46.15 % |
13 VFG041146.gi.206558747. 45 | 3 13.04 % | 42 46.15 % |
18 VFG041969.gi.17549607. 41 | 0 0 % | 41 45.05 % |
22 VFG041974.gi.17549351. 41 | 0 0 % | 41 45.05 % |
63 VFG042027.gi.17548436. 41 | 0 0 % | 41 45.05 % |
76 VFG042043.gi.17546858. 41 | 0 0 % | 41 45.05 % |
84 VFG042053.gi.17546105. 41 | 0 0 % | 41 45.05 % |
88 VFG042058.gi.17545587. 41 | 0 0 % | 41 45.05 % |
93 VFG042064.gi.17544964. 41 | 0 0 % | 41 45.05 % |
20 VFG041971.gi.17549593. 40 | 0 0 % | 40 43.96 % |
30 VFG041985.gi.17549100. 39 | 0 0 % | 39 42.86 % |
64 VFG042028.gi.17548437. 39 | 0 0 % | 39 42.86 % |
65 VFG042030.gi.17548414. 38 | 0 0 % | 38 41.76 % |
77 VFG042044.gi.17546851. 38 | 0 0 % | 38 41.76 % |
17 VFG041968.gi.17549679. 37 | 0 0 % | 37 40.66 % |
23 VFG041976.gi.17549457. 37 | 0 0 % | 37 40.66 % |
27 VFG041981.gi.17549135. 35 | 0 0 % | 35 38.46 % |
87 VFG042057.gi.17546068. 34 | 0 0 % | 34 37.36 % |
91 VFG042062.gi.17545040. 34 | 0 0 % | 34 37.36 % |
24 VFG041977.gi.17549460. 33 | 0 0 % | 33 36.26 % |
85 VFG042054.gi.17546076. 32 | 0 0 % | 32 35.16 % |
90 VFG042061.gi.17545545. 29 | 0 0 % | 29 31.87 % |
72 VFG042039.gi.17547931. 28 | 0 0 % | 28 30.77 % |
59 VFG042022.gi.17548793. 26 | 0 0 % | 26 28.57 % |
4 VFG025402.gi.53723901. 25 | 0 0 % | 25 27.47 % |
71 VFG042038.gi.17548007. 24 | 0 0 % | 24 26.37 % |
33 VFG041988.gi.17549096. 22 | 0 0 % | 22 24.18 % |
80 VFG042048.gi.17546534. 22 | 0 0 % | 22 24.18 % |
92 VFG042063.gi.17544976. 18 | 0 0 % | 18 19.78 % |
73 VFG042040.gi.17547893. 16 | 0 0 % | 16 17.58 % |
6 VFG026325.gi.83720344. 7 | 6 26.09 % | 1 1.1 % |
5 VFG026305.gi.83719377. 6 | 6 26.09 % | 0 0 % |
3 771608516.ref.WP_045219469.1. 9 | 9 39.13 % | 0 0 % |
1 Bla.OXA.60.AY664505.1.816.816 14 | 14 60.87 % | 0 0 % |
94 1331531451.ref.WP_102607461.1. 23 | 23 100 % OUI XXX | 0 0 % |
Colonnes à retenir :
=====================
seuils : présence : >= 85 % ; absence < 15 %
1 cluster(s) permettent de prédire la classe 0 à savoir
Column sum sep1 sum0 pct0 spec0 nearly0 sep2 sum1 pct1 spec1 nearly1 sep3
94 1331531451.ref.WP_102607461.1. 23 | 23 100 OUI XXX | 0 0 |
14 cluster(s) permettent de prédire la classe 1 à savoir :
Column sum sep1 sum0 pct0 spec0 nearly0 sep2 sum1 pct1 spec1 nearly1 sep3
7 VFG040972.gi.17547832. 88 | 0 0.00 | 88 96.70 YYY |
43 VFG041999.gi.17549085. 89 | 1 4.35 | 88 96.70 YYY |
37 VFG041992.gi.17549092. 87 | 0 0.00 | 87 95.60 YYY |
29 VFG041984.gi.17549103. 86 | 0 0.00 | 86 94.51 YYY |
41 VFG041996.gi.17549088. 86 | 0 0.00 | 86 94.51 YYY |
36 VFG041991.gi.17549093. 85 | 0 0.00 | 85 93.41 YYY |
9 VFG040975.gi.17547830. 84 | 0 0.00 | 84 92.31 YYY |
42 VFG041998.gi.17549087. 82 | 0 0.00 | 82 90.11 YYY |
47 VFG042003.gi.17549082. 82 | 0 0.00 | 82 90.11 YYY |
50 VFG042007.gi.17549078. 82 | 0 0.00 | 82 90.11 YYY |
34 VFG041989.gi.17549095. 81 | 0 0.00 | 81 89.01 YYY |
40 VFG041995.gi.17549089. 81 | 0 0.00 | 81 89.01 YYY |
69 VFG042036.gi.17548086. 79 | 0 0.00 | 79 86.81 YYY |
44 VFG042000.gi.17549083. 78 | 0 0.00 | 78 85.71 YYY |
Extrait des données (114 x 95) sur 5 lignes et 5 colonnes
==========================================================
Classe Bla.OXA.60.AY664505.1.816.816 AAN82549.1.ARO.3003369.Escherichia 771608516.ref.WP_045219469.1. VFG025402.gi.53723901.
PLA_000009125 1 0 1 0 1
HUM_000020205 0 1 1 0 0
HUM_000023425 0 1 1 0 0
HUM_000165085 0 1 1 0 0
PLA_000212635 1 0 0 0 0
[...]
Classe Bla.OXA.60.AY664505.1.816.816 AAN82549.1.ARO.3003369.Escherichia 771608516.ref.WP_045219469.1. VFG025402.gi.53723901.
PLA_003860745 1 0 1 0 0
PLA_003860765 1 0 1 0 0
PLA_003999715 1 0 1 0 0
HUM_900115545 0 1 0 0 0
HUM_900455575 0 0 1 1 0
+ ========================================================= +
+ +
+ Study of RALSTONIA data with ANTISMASH and CLASSIFICATION +
+ +
+ ========================================================= +
Rappel des modalités :
Human Associated Plant Associated
0 1
TRI A PLAT DE : Classe (ordre des modalités)
0 1 Total
Effectif 39 108 147
Cumul Effectif 39 147 147
Frequence (en %) 27 73 100
Cumul fréquences 27 100 100
Au départ, taille des données à traiter : 147 x 16
Recherche et supression des colonnes constantes
===============================================
Column Const distinctVals keep/force value
1 Classe No 2 YES 1
2 LAP No 2 0
3 NRPS No 2 1
4 NRPS.like No 2 0
5 T1PKS No 2 1
6 T3PKS No 2 0
7 arylpolyene No 2 1
8 bacteriocin No 2 1
9 betalactone No 2 0
10 butyrolactone No 2 0
11 furan No 2 1
12 hserlactone No 2 1
13 phenazine No 2 0
14 siderophore No 2 1
15 terpene Yes 1 1
16 transAT.PKS No 2 0
17 transAT.PKS.like No 2 0
il y a 1 colonnes constantes, à savoir
Column Const distinctVals keep/force value
15 terpene Yes 1 1
Recherche et suppression de colonnes identiques ou opposées
===========================================================
il y a 1 colonnes redondantes, à savoir
Column
16 transAT.PKS.like
nombre de colonnes au début : 16
nombre de colonnes redondantes : 1
nombre de colonnes en fin : 15
Column Equal Opposite
1 Classe
2 LAP
3 NRPS
4 NRPS.like
5 T1PKS
6 T3PKS
7 arylpolyene
8 bacteriocin
9 betalactone
10 butyrolactone
11 furan
12 hserlactone
13 phenazine
14 siderophore
15 transAT.PKS
Utilisation de nearZeroVariance()
=================================
Essai de détection de lignes égales et contradictions
=====================================================
Extrait des données (147 x 10) sur 5 lignes et 5 colonnes
==========================================================
Classe LAP NRPS NRPS.like T1PKS
PLA_000009125 1 0 1 0 1
HUM_000020205 0 0 0 0 1
HUM_000023425 0 0 0 0 0
HUM_000165085 0 0 0 0 1
PLA_000212635 1 0 1 1 1
[...]
Classe LAP NRPS NRPS.like T1PKS
HUM_900115545 0 0 0 0 0
HUM_900455575 0 0 0 0 0
HUM_900455685 0 0 0 0 0
HUM_900455835 0 0 0 0 1
HUM_900461715 0 0 0 0 0
116 lines removed
Line Equals
1 PLA_000009125 19 20 39 65 66 67 72 74 81 82 85 87 102 103 109 110 111 113 115 129 130 132
2 HUM_000020205 4 8 23 37 38 47 63 64 105 142 146
3 HUM_000023425 11 16 17 18 27 59 86 88 97 100 101 143
5 PLA_000212635 33
6 PLA_000215325 49 83 128 135 137 139
7 PLA_000223115 45 96
9 PLA_000283475
10 PLA_000348545 24 25 36 58 60 68 71 79 80 131 133 141
12 PLA_000427195
13 PLA_000430925 69 126
14 HUM_000442475 46 57
15 PLA_000525615
21 PLA_000710135 22 26 55 56 61 62 70 76 77 78 90 91 92 93 94 95 104
28 PLA_000825785 43
29 PLA_000825805 52
30 PLA_000825825
31 PLA_000825845
32 PLA_000825885
34 HUM_000953875 35 51 84 89 98 99 144 145 147
40 PLA_001373255
41 PLA_001373275
42 PLA_001373295
44 PLA_001373335
48 PLA_001586135 107 108 119 121
50 PLA_001587155 140
53 PLA_001644805 54 136
73 PLA_001887535 112 114 116 117 123 124 125 127
75 PLA_001901665 106
118 PLA_003515425 120 122
134 HUM_003851545
138 PLA_003860725
Classes and contradictions between classes
==========================================
Line Class Equal.Lines Contradictions Classes
[1,] PLA_000009125 1 23 FALSE 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
[2,] HUM_000020205 0 12 FALSE 0 0 0 0 0 0 0 0 0 0 0 0
[3,] HUM_000023425 0 13 FALSE 0 0 0 0 0 0 0 0 0 0 0 0 0
[4,] PLA_000212635 1 2 FALSE 1 1
[5,] PLA_000215325 1 7 FALSE 1 1 1 1 1 1 1
[6,] PLA_000223115 1 3 FALSE 1 1 1
[7,] PLA_000283475 1 1 FALSE 1
[8,] PLA_000348545 1 13 FALSE 1 1 1 1 1 1 1 1 1 1 1 1 1
[9,] PLA_000427195 1 1 FALSE 1
[10,] PLA_000430925 1 3 FALSE 1 1 1
[11,] HUM_000442475 0 3 FALSE 0 0 0
[12,] PLA_000525615 1 1 FALSE 1
[13,] PLA_000710135 1 18 FALSE 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
[14,] PLA_000825785 1 2 FALSE 1 1
[15,] PLA_000825805 1 2 FALSE 1 1
[16,] PLA_000825825 1 1 FALSE 1
[17,] PLA_000825845 1 1 FALSE 1
[18,] PLA_000825885 1 1 FALSE 1
[19,] HUM_000953875 0 10 FALSE 0 0 0 0 0 0 0 0 0 0
[20,] PLA_001373255 1 1 FALSE 1
[21,] PLA_001373275 1 1 FALSE 1
[22,] PLA_001373295 1 1 FALSE 1
[23,] PLA_001373335 1 1 FALSE 1
[24,] PLA_001586135 1 5 FALSE 1 1 1 1 1
[25,] PLA_001587155 1 2 FALSE 1 1
[26,] PLA_001644805 1 3 FALSE 1 1 1
[27,] PLA_001887535 1 9 FALSE 1 1 1 1 1 1 1 1 1
[28,] PLA_001901665 1 2 FALSE 1 1
[29,] PLA_003515425 1 3 FALSE 1 1 1
[30,] HUM_003851545 0 1 FALSE 0
[31,] PLA_003860725 1 1 FALSE 1
Traitement dimensionsDeb dimensionsFin
1 Colonnes constantes 147 x 16 147 x 15
2 Colonnes identiques ou opposées 147 x 15 147 x 14
3 Ajout_a_posteriori 147 x 14 147 x 14
4 Colonnes de faible variance 147 x 14 147 x 9
5 Lignes égales 147 x 9 31 x 9
Au final, taille des données à traiter : 31 x 10
Extrait des données données restantes (31 x 10) sur 5 lignes et 5 colonnes
==========================================================================
Classe LAP NRPS NRPS.like T1PKS
PLA_000009125 1 0 1 0 1
HUM_000020205 0 0 0 0 1
HUM_000023425 0 0 0 0 0
PLA_000212635 1 0 1 1 1
PLA_000215325 1 0 1 1 1
[...]
Classe LAP NRPS NRPS.like T1PKS
PLA_001887535 1 1 1 0 1
PLA_001901665 1 0 1 0 1
PLA_003515425 1 1 0 0 1
HUM_003851545 0 0 0 0 1
PLA_003860725 1 0 1 1 1
donnée dfData 31 x 10 sauvegardées dans analysecl.rdata
Recherche de colonnes spécifiques de la classe, seuil 90 %
===========================================================
Rappel des effectifs par classe pour les 31 lignes de données:
0 1
5 26
Column sum sep1 sum0 pct0 spec0 nearly0 sep2 sum1 pct1 spec1 nearly1 sep3
1 LAP 6 | 0 0 % | 6 23.08 % |
2 NRPS 24 | 0 0 % | 24 92.31 % YYY |
3 NRPS.like 15 | 0 0 % | 15 57.69 % |
4 T1PKS 22 | 3 60 % | 19 73.08 % |
5 betalactone 6 | 3 60 % | 3 11.54 % |
6 furan 14 | 0 0 % | 14 53.85 % |
7 hserlactone 24 | 0 0 % | 24 92.31 % YYY |
8 siderophore 20 | 4 80 % | 16 61.54 % |
9 transAT.PKS 10 | 0 0 % | 10 38.46 % |
Affichage par meilleure différence de pourcentages
==================================================
Column sum sep1 sum0 pct0 spec0 nearly0 sep2 sum1 pct1 spec1 nearly1 sep3
2 NRPS 24 | 0 0 % | 24 92.31 % YYY |
7 hserlactone 24 | 0 0 % | 24 92.31 % YYY |
4 T1PKS 22 | 3 60 % | 19 73.08 % |
8 siderophore 20 | 4 80 % | 16 61.54 % |
3 NRPS.like 15 | 0 0 % | 15 57.69 % |
6 furan 14 | 0 0 % | 14 53.85 % |
9 transAT.PKS 10 | 0 0 % | 10 38.46 % |
1 LAP 6 | 0 0 % | 6 23.08 % |
5 betalactone 6 | 3 60 % | 3 11.54 % |
Colonnes à retenir :
=====================
seuils : présence : >= 90 % ; absence < 10 %
aucun cluster ne permet de prédire la classe 0
2 cluster(s) permettent de prédire la classe 1 à savoir :
Column sum sep1 sum0 pct0 spec0 nearly0 sep2 sum1 pct1 spec1 nearly1 sep3
2 NRPS 24 | 0 0 | 24 92.31 YYY |
7 hserlactone 24 | 0 0 | 24 92.31 YYY |
Extrait des données (31 x 10) sur 5 lignes et 5 colonnes
=========================================================
Classe LAP NRPS NRPS.like T1PKS
PLA_000009125 1 0 1 0 1
HUM_000020205 0 0 0 0 1
HUM_000023425 0 0 0 0 0
PLA_000212635 1 0 1 1 1
PLA_000215325 1 0 1 1 1
[...]
Classe LAP NRPS NRPS.like T1PKS
PLA_001887535 1 1 1 0 1
PLA_001901665 1 0 1 0 1
PLA_003515425 1 1 0 0 1
HUM_003851545 0 0 0 0 1
PLA_003860725 1 0 1 1 1
vous pouvez consulter ralsto-antismash.png
+ ====================================================== +
+ +
+ Study of RALSTONIA data with DBGWAS and CLASSIFICATION +
+ +
+ ====================================================== +
Rappel des modalités :
Human Associated Plant Associated
0 1
TRI A PLAT DE : Classe (ordre des modalités)
0 1 Total
Effectif 39 108 147
Cumul Effectif 39 147 147
Frequence (en %) 27 73 100
Cumul fréquences 27 100 100
Au départ, taille des données à traiter : 147 x 12265
Recherche et supression des colonnes constantes
===============================================
il n'y a aucune colonne constante dans ces 147 x 12266 données
Recherche et suppression de colonnes identiques ou opposées
===========================================================
il y a 12165 colonnes redondantes, à savoir
[...]
Utilisation de nearZeroVariance()
=================================
Essai de détection de lignes égales et contradictions
=====================================================
Extrait des données (147 x 101) sur 5 lignes et 5 colonnes
===========================================================
Classe 1695 2247 2643 5523
PLA_000009125 1 0 0 0 0
HUM_000020205 0 1 1 1 1
HUM_000023425 0 1 1 1 0
HUM_000165085 0 1 1 1 0
PLA_000212635 1 0 0 0 0
[...]
Classe 1695 2247 2643 5523
HUM_900115545 0 1 1 1 1
HUM_900455575 0 1 0 1 1
HUM_900455685 0 1 0 1 1
HUM_900455835 0 1 1 1 0
HUM_900461715 0 1 0 1 1
110 lines removed
Line Equals
1 PLA_000009125 7 10 13 19 20 45 55 56 58 65 66 67 68 69 70 71 72 73 74 79 80 81 90 96 102 103 104 110 111 112 114 115 116 117 123 124 125 126 127 129 130 131 133 141
2 HUM_000020205 64
3 HUM_000023425 86
4 HUM_000165085 8 23 47 142 146
5 PLA_000212635 30 33
6 PLA_000215325 15 29 32 49 50 137 138 139 140
9 PLA_000283475 109 113
11 HUM_000372665
12 PLA_000427195
14 HUM_000442475 37 46 57
16 HUM_000607165 105
17 HUM_000607185
18 HUM_000620465
21 PLA_000710135 22 25 26 36 39 42 60 61 62 76 77 78 82 85 91 92 93 94 95
24 PLA_000749995
27 HUM_000801955
28 PLA_000825785 41
31 PLA_000825845 43 135 136
34 HUM_000953875 35 89 98 144 145 147
38 HUM_001078575
40 PLA_001373255
44 PLA_001373335
48 PLA_001586135 107 108 118 119 120 121 122
51 HUM_001628775 84 99
52 PLA_001644795
53 PLA_001644805 87 106
54 PLA_001644855
59 HUM_001663855 97
63 HUM_001699795
75 PLA_001901665
83 PLA_002251695 128
88 HUM_002849525
100 HUM_002939165
101 HUM_003096975
132 PLA_003612975
134 HUM_003851545
143 HUM_900115545
Classes and contradictions between classes
==========================================
Line Class Equal.Lines Contradictions Classes
[1,] PLA_000009125 1 45 FALSE 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
[2,] HUM_000020205 0 2 FALSE 0 0
[3,] HUM_000023425 0 2 FALSE 0 0
[4,] HUM_000165085 0 6 FALSE 0 0 0 0 0 0
[5,] PLA_000212635 1 3 FALSE 1 1 1
[6,] PLA_000215325 1 10 FALSE 1 1 1 1 1 1 1 1 1 1
[7,] PLA_000283475 1 3 FALSE 1 1 1
[8,] HUM_000372665 0 1 FALSE 0
[9,] PLA_000427195 1 1 FALSE 1
[10,] HUM_000442475 0 4 FALSE 0 0 0 0
[11,] HUM_000607165 0 2 FALSE 0 0
[12,] HUM_000607185 0 1 FALSE 0
[13,] HUM_000620465 0 1 FALSE 0
[14,] PLA_000710135 1 20 FALSE 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
[15,] PLA_000749995 1 1 FALSE 1
[16,] HUM_000801955 0 1 FALSE 0
[17,] PLA_000825785 1 2 FALSE 1 1
[18,] PLA_000825845 1 4 FALSE 1 1 1 1
[19,] HUM_000953875 0 7 FALSE 0 0 0 0 0 0 0
[20,] HUM_001078575 0 1 FALSE 0
[21,] PLA_001373255 1 1 FALSE 1
[22,] PLA_001373335 1 1 FALSE 1
[23,] PLA_001586135 1 8 FALSE 1 1 1 1 1 1 1 1
[24,] HUM_001628775 0 3 FALSE 0 0 0
[25,] PLA_001644795 1 1 FALSE 1
[26,] PLA_001644805 1 3 FALSE 1 1 1
[27,] PLA_001644855 1 1 FALSE 1
[28,] HUM_001663855 0 2 FALSE 0 0
[29,] HUM_001699795 0 1 FALSE 0
[30,] PLA_001901665 1 1 FALSE 1
[31,] PLA_002251695 1 2 FALSE 1 1
[32,] HUM_002849525 0 1 FALSE 0
[33,] HUM_002939165 0 1 FALSE 0
[34,] HUM_003096975 0 1 FALSE 0
[35,] PLA_003612975 1 1 FALSE 1
[36,] HUM_003851545 0 1 FALSE 0
[37,] HUM_900115545 0 1 FALSE 0
Traitement dimensionsDeb dimensionsFin
1 Colonnes constantes 147 x 12265 147 x 12265
2 Colonnes identiques ou opposées 147 x 12265 147 x 100
3 Ajout_a_posteriori 147 x 100 147 x 100
4 Colonnes de faible variance 147 x 100 147 x 100
5 Lignes égales 147 x 100 37 x 100
Au final, taille des données à traiter : 37 x 101
Extrait des données données restantes (37 x 101) sur 5 lignes et 5 colonnes
===========================================================================
Classe 1695 2247 2643 5523
PLA_000009125 1 0 0 0 0
HUM_000020205 0 1 1 1 1
HUM_000023425 0 1 1 1 0
HUM_000165085 0 1 1 1 0
PLA_000212635 1 0 0 0 0
[...]
Classe 1695 2247 2643 5523
HUM_002939165 0 1 1 1 1
HUM_003096975 0 1 1 1 0
PLA_003612975 1 0 0 0 0
HUM_003851545 0 1 1 1 1
HUM_900115545 0 1 1 1 1
Recherche de colonnes spécifiques de la classe, seuil 90 %
===========================================================
Rappel des effectifs par classe pour les 37 lignes de données:
0 1
19 18
Column sum sep1 sum0 pct0 spec0 nearly0 sep2 sum1 pct1 spec1 nearly1 sep3
1 1695 18 | 18 94.74 % XXX | 0 0 % |
2 2247 17 | 17 89.47 % | 0 0 % |
3 2643 19 | 19 100 % OUI XXX | 0 0 % |
4 5523 13 | 13 68.42 % | 0 0 % |
5 7189 21 | 19 100 % OUI XXX | 2 11.11 % |
6 10159 18 | 18 94.74 % XXX | 0 0 % |
7 10943 15 | 0 0 % | 15 83.33 % |
8 23067 21 | 19 100 % OUI XXX | 2 11.11 % |
9 23997 24 | 19 100 % OUI XXX | 5 27.78 % |
10 30575 16 | 16 84.21 % | 0 0 % |
11 31816 17 | 17 89.47 % | 0 0 % |
12 32264 17 | 17 89.47 % | 0 0 % |
13 33189 15 | 15 78.95 % | 0 0 % |
14 36229 18 | 18 94.74 % XXX | 0 0 % |
15 37361 20 | 19 100 % OUI XXX | 1 5.56 % |
16 39174 21 | 19 100 % OUI XXX | 2 11.11 % |
17 40801 16 | 16 84.21 % | 0 0 % |
18 45054 20 | 19 100 % OUI XXX | 1 5.56 % |
19 49651 20 | 19 100 % OUI XXX | 1 5.56 % |
20 61357 20 | 19 100 % OUI XXX | 1 5.56 % |
21 68642 12 | 0 0 % | 12 66.67 % |
22 75200 18 | 18 94.74 % XXX | 0 0 % |
23 76862 18 | 18 94.74 % XXX | 0 0 % |
24 79073 17 | 17 89.47 % | 0 0 % |
25 118865 17 | 0 0 % | 17 94.44 % YYY |
26 121159 18 | 18 94.74 % XXX | 0 0 % |
27 122497 20 | 19 100 % OUI XXX | 1 5.56 % |
28 128820 20 | 19 100 % OUI XXX | 1 5.56 % |
29 128849 20 | 19 100 % OUI XXX | 1 5.56 % |
30 136319 20 | 19 100 % OUI XXX | 1 5.56 % |
31 139335 18 | 18 94.74 % XXX | 0 0 % |
32 143702 20 | 19 100 % OUI XXX | 1 5.56 % |
33 157961 21 | 19 100 % OUI XXX | 2 11.11 % |
34 162990 18 | 18 94.74 % XXX | 0 0 % |
35 171592 20 | 19 100 % OUI XXX | 1 5.56 % |
36 172081 18 | 1 5.26 % | 17 94.44 % YYY |
37 176526 10 | 10 52.63 % | 0 0 % |
38 186674 16 | 0 0 % | 16 88.89 % |
39 191677 18 | 18 94.74 % XXX | 0 0 % |
40 201475 18 | 18 94.74 % XXX | 0 0 % |
41 215491 23 | 19 100 % OUI XXX | 4 22.22 % |
42 220239 18 | 18 94.74 % XXX | 0 0 % |
43 226442 15 | 15 78.95 % | 0 0 % |
44 234249 22 | 19 100 % OUI XXX | 3 16.67 % |
45 243305 17 | 17 89.47 % | 0 0 % |
46 244927 20 | 19 100 % OUI XXX | 1 5.56 % |
47 252962 18 | 18 94.74 % XXX | 0 0 % |
48 265835 16 | 0 0 % | 16 88.89 % |
49 321908 16 | 16 84.21 % | 0 0 % |
50 321969 18 | 18 94.74 % XXX | 0 0 % |
51 329029 17 | 17 89.47 % | 0 0 % |
52 337578 20 | 19 100 % OUI XXX | 1 5.56 % |
53 339242 18 | 17 89.47 % | 1 5.56 % |
54 340550 16 | 16 84.21 % | 0 0 % |
55 358895 16 | 16 84.21 % | 0 0 % |
56 395208 18 | 18 94.74 % XXX | 0 0 % |
57 425835 17 | 17 89.47 % | 0 0 % |
58 448953 17 | 17 89.47 % | 0 0 % |
59 454155 17 | 17 89.47 % | 0 0 % |
60 487487 18 | 18 94.74 % XXX | 0 0 % |
61 534769 17 | 17 89.47 % | 0 0 % |
62 547562 17 | 17 89.47 % | 0 0 % |
63 560561 20 | 19 100 % OUI XXX | 1 5.56 % |
64 583999 17 | 17 89.47 % | 0 0 % |
65 661171 19 | 18 94.74 % XXX | 1 5.56 % |
66 676979 12 | 12 63.16 % | 0 0 % |
67 764987 17 | 17 89.47 % | 0 0 % |
68 863177 20 | 19 100 % OUI XXX | 1 5.56 % |
69 868104 25 | 19 100 % OUI XXX | 6 33.33 % |
70 868650 16 | 16 84.21 % | 0 0 % |
71 909609 17 | 17 89.47 % | 0 0 % |
72 913571 18 | 18 94.74 % XXX | 0 0 % |
73 972118 18 | 18 94.74 % XXX | 0 0 % |
74 995132 16 | 16 84.21 % | 0 0 % |
75 1023862 23 | 19 100 % OUI XXX | 4 22.22 % |
76 1032423 16 | 16 84.21 % | 0 0 % |
77 1088277 18 | 18 94.74 % XXX | 0 0 % |
78 1112299 16 | 16 84.21 % | 0 0 % |
79 1154732 22 | 19 100 % OUI XXX | 3 16.67 % |
80 1203771 16 | 0 0 % | 16 88.89 % |
81 1252350 19 | 2 10.53 % | 17 94.44 % YYY |
82 1375862 17 | 17 89.47 % | 0 0 % |
83 1390326 17 | 17 89.47 % | 0 0 % |
84 1428442 17 | 17 89.47 % | 0 0 % |
85 1633526 15 | 15 78.95 % | 0 0 % |
86 1865437 13 | 13 68.42 % | 0 0 % |
87 1906390 17 | 17 89.47 % | 0 0 % |
88 1919222 17 | 17 89.47 % | 0 0 % |
89 2007404 17 | 17 89.47 % | 0 0 % |
90 2080554 15 | 15 78.95 % | 0 0 % |
91 2143113 16 | 0 0 % | 16 88.89 % |
92 2211031 18 | 1 5.26 % | 17 94.44 % YYY |
93 2522690 22 | 19 100 % OUI XXX | 3 16.67 % |
94 2530782 15 | 15 78.95 % | 0 0 % |
95 2940264 14 | 14 73.68 % | 0 0 % |
96 3005917 17 | 17 89.47 % | 0 0 % |
97 3097382 17 | 17 89.47 % | 0 0 % |
98 3841246 17 | 17 89.47 % | 0 0 % |
99 3886996 17 | 17 89.47 % | 0 0 % |
100 4214099 21 | 19 100 % OUI XXX | 2 11.11 % |
Affichage par meilleure différence de pourcentages
==================================================
Column sum sep1 sum0 pct0 spec0 nearly0 sep2 sum1 pct1 spec1 nearly1 sep3
25 118865 17 | 0 0 % | 17 94.44 % YYY |
36 172081 18 | 1 5.26 % | 17 94.44 % YYY |
92 2211031 18 | 1 5.26 % | 17 94.44 % YYY |
81 1252350 19 | 2 10.53 % | 17 94.44 % YYY |
38 186674 16 | 0 0 % | 16 88.89 % |
48 265835 16 | 0 0 % | 16 88.89 % |
80 1203771 16 | 0 0 % | 16 88.89 % |
91 2143113 16 | 0 0 % | 16 88.89 % |
7 10943 15 | 0 0 % | 15 83.33 % |
21 68642 12 | 0 0 % | 12 66.67 % |
69 868104 25 | 19 100 % OUI XXX | 6 33.33 % |
9 23997 24 | 19 100 % OUI XXX | 5 27.78 % |
41 215491 23 | 19 100 % OUI XXX | 4 22.22 % |
75 1023862 23 | 19 100 % OUI XXX | 4 22.22 % |
44 234249 22 | 19 100 % OUI XXX | 3 16.67 % |
79 1154732 22 | 19 100 % OUI XXX | 3 16.67 % |
93 2522690 22 | 19 100 % OUI XXX | 3 16.67 % |
5 7189 21 | 19 100 % OUI XXX | 2 11.11 % |
8 23067 21 | 19 100 % OUI XXX | 2 11.11 % |
16 39174 21 | 19 100 % OUI XXX | 2 11.11 % |
33 157961 21 | 19 100 % OUI XXX | 2 11.11 % |
100 4214099 21 | 19 100 % OUI XXX | 2 11.11 % |
53 339242 18 | 17 89.47 % | 1 5.56 % |
65 661171 19 | 18 94.74 % XXX | 1 5.56 % |
15 37361 20 | 19 100 % OUI XXX | 1 5.56 % |
18 45054 20 | 19 100 % OUI XXX | 1 5.56 % |
19 49651 20 | 19 100 % OUI XXX | 1 5.56 % |
20 61357 20 | 19 100 % OUI XXX | 1 5.56 % |
27 122497 20 | 19 100 % OUI XXX | 1 5.56 % |
28 128820 20 | 19 100 % OUI XXX | 1 5.56 % |
29 128849 20 | 19 100 % OUI XXX | 1 5.56 % |
30 136319 20 | 19 100 % OUI XXX | 1 5.56 % |
32 143702 20 | 19 100 % OUI XXX | 1 5.56 % |
35 171592 20 | 19 100 % OUI XXX | 1 5.56 % |
46 244927 20 | 19 100 % OUI XXX | 1 5.56 % |
52 337578 20 | 19 100 % OUI XXX | 1 5.56 % |
63 560561 20 | 19 100 % OUI XXX | 1 5.56 % |
68 863177 20 | 19 100 % OUI XXX | 1 5.56 % |
37 176526 10 | 10 52.63 % | 0 0 % |
66 676979 12 | 12 63.16 % | 0 0 % |
4 5523 13 | 13 68.42 % | 0 0 % |
86 1865437 13 | 13 68.42 % | 0 0 % |
95 2940264 14 | 14 73.68 % | 0 0 % |
13 33189 15 | 15 78.95 % | 0 0 % |
43 226442 15 | 15 78.95 % | 0 0 % |
85 1633526 15 | 15 78.95 % | 0 0 % |
90 2080554 15 | 15 78.95 % | 0 0 % |
94 2530782 15 | 15 78.95 % | 0 0 % |
10 30575 16 | 16 84.21 % | 0 0 % |
17 40801 16 | 16 84.21 % | 0 0 % |
49 321908 16 | 16 84.21 % | 0 0 % |
54 340550 16 | 16 84.21 % | 0 0 % |
55 358895 16 | 16 84.21 % | 0 0 % |
70 868650 16 | 16 84.21 % | 0 0 % |
74 995132 16 | 16 84.21 % | 0 0 % |
76 1032423 16 | 16 84.21 % | 0 0 % |
78 1112299 16 | 16 84.21 % | 0 0 % |
2 2247 17 | 17 89.47 % | 0 0 % |
11 31816 17 | 17 89.47 % | 0 0 % |
12 32264 17 | 17 89.47 % | 0 0 % |
24 79073 17 | 17 89.47 % | 0 0 % |
45 243305 17 | 17 89.47 % | 0 0 % |
51 329029 17 | 17 89.47 % | 0 0 % |
57 425835 17 | 17 89.47 % | 0 0 % |
58 448953 17 | 17 89.47 % | 0 0 % |
59 454155 17 | 17 89.47 % | 0 0 % |
61 534769 17 | 17 89.47 % | 0 0 % |
62 547562 17 | 17 89.47 % | 0 0 % |
64 583999 17 | 17 89.47 % | 0 0 % |
67 764987 17 | 17 89.47 % | 0 0 % |
71 909609 17 | 17 89.47 % | 0 0 % |
82 1375862 17 | 17 89.47 % | 0 0 % |
83 1390326 17 | 17 89.47 % | 0 0 % |
84 1428442 17 | 17 89.47 % | 0 0 % |
87 1906390 17 | 17 89.47 % | 0 0 % |
88 1919222 17 | 17 89.47 % | 0 0 % |
89 2007404 17 | 17 89.47 % | 0 0 % |
96 3005917 17 | 17 89.47 % | 0 0 % |
97 3097382 17 | 17 89.47 % | 0 0 % |
98 3841246 17 | 17 89.47 % | 0 0 % |
99 3886996 17 | 17 89.47 % | 0 0 % |
1 1695 18 | 18 94.74 % XXX | 0 0 % |
6 10159 18 | 18 94.74 % XXX | 0 0 % |
14 36229 18 | 18 94.74 % XXX | 0 0 % |
22 75200 18 | 18 94.74 % XXX | 0 0 % |
23 76862 18 | 18 94.74 % XXX | 0 0 % |
26 121159 18 | 18 94.74 % XXX | 0 0 % |
31 139335 18 | 18 94.74 % XXX | 0 0 % |
34 162990 18 | 18 94.74 % XXX | 0 0 % |
39 191677 18 | 18 94.74 % XXX | 0 0 % |
40 201475 18 | 18 94.74 % XXX | 0 0 % |
42 220239 18 | 18 94.74 % XXX | 0 0 % |
47 252962 18 | 18 94.74 % XXX | 0 0 % |
50 321969 18 | 18 94.74 % XXX | 0 0 % |
56 395208 18 | 18 94.74 % XXX | 0 0 % |
60 487487 18 | 18 94.74 % XXX | 0 0 % |
72 913571 18 | 18 94.74 % XXX | 0 0 % |
73 972118 18 | 18 94.74 % XXX | 0 0 % |
77 1088277 18 | 18 94.74 % XXX | 0 0 % |
3 2643 19 | 19 100 % OUI XXX | 0 0 % |
Colonnes à retenir :
=====================
seuils : présence : >= 90 % ; absence < 10 %
34 cluster(s) permettent de prédire la classe 0 à savoir
Column sum sep1 sum0 pct0 spec0 nearly0 sep2 sum1 pct1 spec1 nearly1 sep3
3 2643 19 | 19 100.00 OUI XXX | 0 0.00 |
15 37361 20 | 19 100.00 OUI XXX | 1 5.56 |
18 45054 20 | 19 100.00 OUI XXX | 1 5.56 |
19 49651 20 | 19 100.00 OUI XXX | 1 5.56 |
20 61357 20 | 19 100.00 OUI XXX | 1 5.56 |
27 122497 20 | 19 100.00 OUI XXX | 1 5.56 |
28 128820 20 | 19 100.00 OUI XXX | 1 5.56 |
29 128849 20 | 19 100.00 OUI XXX | 1 5.56 |
30 136319 20 | 19 100.00 OUI XXX | 1 5.56 |
32 143702 20 | 19 100.00 OUI XXX | 1 5.56 |
35 171592 20 | 19 100.00 OUI XXX | 1 5.56 |
46 244927 20 | 19 100.00 OUI XXX | 1 5.56 |
52 337578 20 | 19 100.00 OUI XXX | 1 5.56 |
63 560561 20 | 19 100.00 OUI XXX | 1 5.56 |
68 863177 20 | 19 100.00 OUI XXX | 1 5.56 |
1 1695 18 | 18 94.74 XXX | 0 0.00 |
6 10159 18 | 18 94.74 XXX | 0 0.00 |
14 36229 18 | 18 94.74 XXX | 0 0.00 |
22 75200 18 | 18 94.74 XXX | 0 0.00 |
23 76862 18 | 18 94.74 XXX | 0 0.00 |
26 121159 18 | 18 94.74 XXX | 0 0.00 |
31 139335 18 | 18 94.74 XXX | 0 0.00 |
34 162990 18 | 18 94.74 XXX | 0 0.00 |
39 191677 18 | 18 94.74 XXX | 0 0.00 |
40 201475 18 | 18 94.74 XXX | 0 0.00 |
42 220239 18 | 18 94.74 XXX | 0 0.00 |
47 252962 18 | 18 94.74 XXX | 0 0.00 |
50 321969 18 | 18 94.74 XXX | 0 0.00 |
56 395208 18 | 18 94.74 XXX | 0 0.00 |
60 487487 18 | 18 94.74 XXX | 0 0.00 |
72 913571 18 | 18 94.74 XXX | 0 0.00 |
73 972118 18 | 18 94.74 XXX | 0 0.00 |
77 1088277 18 | 18 94.74 XXX | 0 0.00 |
65 661171 19 | 18 94.74 XXX | 1 5.56 |
3 cluster(s) permettent de prédire la classe 1 à savoir :
Column sum sep1 sum0 pct0 spec0 nearly0 sep2 sum1 pct1 spec1 nearly1 sep3
25 118865 17 | 0 0.00 | 17 94.44 YYY |
36 172081 18 | 1 5.26 | 17 94.44 YYY |
92 2211031 18 | 1 5.26 | 17 94.44 YYY |
Extrait des données (37 x 101) sur 5 lignes et 5 colonnes
==========================================================
Classe 1695 2247 2643 5523
PLA_000009125 1 0 0 0 0
HUM_000020205 0 1 1 1 1
HUM_000023425 0 1 1 1 0
HUM_000165085 0 1 1 1 0
PLA_000212635 1 0 0 0 0
[...]
Classe 1695 2247 2643 5523
HUM_002939165 0 1 1 1 1
HUM_003096975 0 1 1 1 0
PLA_003612975 1 0 0 0 0
HUM_003851545 0 1 1 1 1
HUM_900115545 0 1 1 1 1
+ =========== +
+ +
+ predipath +
+ +
+ =========== +
TRI A PLAT DE : Classe PREDIPATH (ordre des modalités)
0 1 Total
Effectif 39 108 147
Cumul Effectif 39 147 147
Frequence (en %) 27 73 100
Cumul fréquences 27 100 100
TRI A PLAT DE : 1331... PREDIPATH (ordre des modalités)
0 1 Total
Effectif 108 39 147
Cumul Effectif 108 147 147
Frequence (en %) 73 27 100
Cumul fréquences 73 100 100
Classe et 1331531451.ref.WP_102607461.1. sont opposés dans PREDIPATH...
-----------------------------------------------------------------------
0 1
0 0 39
1 108 0
rpredic.Classe INVERSE_DE_1331
[1,] 1 1
[2,] 0 0
[3,] 0 0
[4,] 0 0
[5,] 1 1
[6,] 1 1
null device
1
+ ======== +
+ +
+ dbgwas +
+ +
+ ======== +
TRI A PLAT DE : Classe DBGWAS (ordre des modalités)
0 1 Total
Effectif 39 108 147
Cumul Effectif 39 147 147
Frequence (en %) 27 73 100
Cumul fréquences 27 100 100
TRI A PLAT DE : 2643 RDBGWAS (ordre des modalités)
0 1 Total
Effectif 108 39 147
Cumul Effectif 108 147 147
Frequence (en %) 73 27 100
Cumul fréquences 73 100 100
Classe et 2643 sont opposés dans DBGWAS...
------------------------------------------
0 1
0 0 39
1 108 0
rdbgwasc....Classe.. INVERSE_DE_2643
[1,] 1 1
[2,] 0 0
[3,] 0 0
[4,] 0 0
[5,] 1 1
[6,] 1 1
Extrait des données (31 x 10) sur 5 lignes et 5 colonnes
=========================================================
Classe LAP NRPS NRPS.like T1PKS
000009125 1 0 1 0 1
000020205 0 0 0 0 1
000023425 0 0 0 0 0
000212635 1 0 1 1 1
000215325 1 0 1 1 1
[...]
Classe LAP NRPS NRPS.like T1PKS
001887535 1 1 1 0 1
001901665 1 0 1 0 1
003515425 1 1 0 0 1
003851545 0 0 0 0 1
003860725 1 0 1 1 1
AVEC UNE SEULE COLONNE
======================
Column AUROC
2 NRPS 0.9615
7 hserlactone 0.9615
3 NRPS.like 0.7885
6 furan 0.7692
5 betalactone 0.7423
9 transAT.PKS 0.6923
1 LAP 0.6154
8 siderophore 0.5923
4 T1PKS 0.5654
STEP AIC
========
Extrait des données (31 x 9) sur 5 lignes et 5 colonnes
========================================================
LAP NRPS NRPS.like T1PKS betalactone
000009125 0 1 0 1 0
000020205 0 0 0 1 1
000023425 0 0 0 0 1
000212635 0 1 1 1 0
000215325 0 1 1 1 0
[...]
LAP NRPS NRPS.like T1PKS betalactone
001887535 1 1 0 1 0
001901665 0 1 0 1 0
003515425 1 0 0 1 0
003851545 0 0 0 1 0
003860725 0 1 1 1 0
Start: AIC=20
Classe ~ LAP + NRPS + NRPS.like + T1PKS + betalactone + furan +
hserlactone + siderophore + transAT.PKS
Df Deviance AIC
- siderophore 1 2.8858e-10 18
- NRPS.like 1 2.8859e-10 18
- T1PKS 1 2.8881e-10 18
- betalactone 1 2.8943e-10 18
- furan 1 2.8999e-10 18
- transAT.PKS 1 2.9332e-10 18
- hserlactone 1 2.9572e-10 18
- LAP 1 3.5885e-10 18
- NRPS 1 4.9118e-10 18
2.8822e-10 20
Step: AIC=18
Classe ~ LAP + NRPS + NRPS.like + T1PKS + betalactone + furan +
hserlactone + transAT.PKS
Df Deviance AIC
- T1PKS 1 2.8942e-10 16
- NRPS.like 1 2.8963e-10 16
- betalactone 1 2.8970e-10 16
- furan 1 2.9100e-10 16
- transAT.PKS 1 2.9496e-10 16
- hserlactone 1 2.9656e-10 16
- LAP 1 3.5938e-10 16
- NRPS 1 4.9236e-10 16
2.8858e-10 18
+ siderophore 1 2.8822e-10 20
Step: AIC=16
Classe ~ LAP + NRPS + NRPS.like + betalactone + furan + hserlactone +
transAT.PKS
Df Deviance AIC
- betalactone 1 2.9035e-10 14
- NRPS.like 1 2.9157e-10 14
- furan 1 2.9254e-10 14
- transAT.PKS 1 2.9555e-10 14
- hserlactone 1 2.9709e-10 14
- LAP 1 3.6124e-10 14
- NRPS 1 4.9480e-10 14
2.8942e-10 16
+ T1PKS 1 2.8858e-10 18
+ siderophore 1 2.8881e-10 18
Step: AIC=14
Classe ~ LAP + NRPS + NRPS.like + furan + hserlactone + transAT.PKS
Df Deviance AIC
- NRPS.like 1 2.9321e-10 12
- furan 1 2.9463e-10 12
- transAT.PKS 1 2.9696e-10 12
- hserlactone 1 2.9848e-10 12
- LAP 1 3.6377e-10 12
- NRPS 1 4.9923e-10 12
2.9035e-10 14
+ betalactone 1 2.8942e-10 16
+ T1PKS 1 2.8970e-10 16
+ siderophore 1 2.8985e-10 16
Step: AIC=12
Classe ~ LAP + NRPS + furan + hserlactone + transAT.PKS
Df Deviance AIC
- furan 1 2.9710e-10 10
- hserlactone 1 2.9896e-10 10
- transAT.PKS 1 3.0293e-10 10
- LAP 1 3.9062e-10 10
- NRPS 1 5.1692e-10 10
2.9321e-10 12
+ NRPS.like 1 2.9035e-10 14
+ siderophore 1 2.9137e-10 14
+ betalactone 1 2.9157e-10 14
+ T1PKS 1 2.9173e-10 14
Step: AIC=10
Classe ~ LAP + NRPS + hserlactone + transAT.PKS
Df Deviance AIC
- hserlactone 1 0.0000 8.000
- transAT.PKS 1 0.0000 8.000
- LAP 1 0.0000 8.000
0.0000 10.000
+ furan 1 0.0000 12.000
+ betalactone 1 0.0000 12.000
+ siderophore 1 0.0000 12.000
+ NRPS.like 1 0.0000 12.000
+ T1PKS 1 0.0000 12.000
- NRPS 1 8.3758 16.376
Step: AIC=8
Classe ~ LAP + NRPS + transAT.PKS
Df Deviance AIC
- transAT.PKS 1 0.000 6.000
- LAP 1 0.000 6.000
0.000 8.000
+ hserlactone 1 0.000 10.000
+ betalactone 1 0.000 10.000
+ siderophore 1 0.000 10.000
+ furan 1 0.000 10.000
+ NRPS.like 1 0.000 10.000
+ T1PKS 1 0.000 10.000
- NRPS 1 20.597 26.597
Step: AIC=6
Classe ~ LAP + NRPS
Df Deviance AIC
0.0000 6.000
+ transAT.PKS 1 0.0000 8.000
+ hserlactone 1 0.0000 8.000
+ siderophore 1 0.0000 8.000
+ NRPS.like 1 0.0000 8.000
+ betalactone 1 0.0000 8.000
+ furan 1 0.0000 8.000
+ T1PKS 1 0.0000 8.000
- LAP 1 8.3758 12.376
- NRPS 1 25.0201 29.020
Stepwise Model Path
Analysis of Deviance Table
Initial Model:
Classe ~ LAP + NRPS + NRPS.like + T1PKS + betalactone + furan +
hserlactone + siderophore + transAT.PKS
Final Model:
Classe ~ LAP + NRPS
Step Df Deviance Resid. Df Resid. Dev AIC
1 21 2.882166e-10 20
2 - siderophore 1 3.645972e-13 22 2.885812e-10 18
3 - T1PKS 1 8.339995e-13 23 2.894152e-10 16
4 - betalactone 1 9.348078e-13 24 2.903500e-10 14
5 - NRPS.like 1 2.863487e-12 25 2.932135e-10 12
6 - furan 1 3.890221e-12 26 2.971037e-10 10
7 - hserlactone 1 4.090506e-12 27 3.011942e-10 8
8 - transAT.PKS 1 1.311884e-11 28 3.143130e-10 6
Classe NRPS LAP
000020205 0 0 0
000023425 0 0 0
000442475 0 0 0
000953875 0 0 0
003851545 0 0 0
000525615 1 0 1
003515425 1 0 1
000009125 1 1 0
000212635 1 1 0
000215325 1 1 0
000223115 1 1 0
000283475 1 1 0
000348545 1 1 0
000710135 1 1 0
000825785 1 1 0
000825805 1 1 0
000825825 1 1 0
000825845 1 1 0
000825885 1 1 0
001373255 1 1 0
001373275 1 1 0
001373295 1 1 0
001586135 1 1 0
001587155 1 1 0
001644805 1 1 0
001901665 1 1 0
003860725 1 1 0
000427195 1 1 1
000430925 1 1 1
001373335 1 1 1
001887535 1 1 1