-
Notifications
You must be signed in to change notification settings - Fork 5
/
trainModel.py
118 lines (88 loc) · 3.97 KB
/
trainModel.py
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
# IMPORT
import numpy as np
import os
import keras
from sklearn.model_selection import train_test_split
from keras.models import Sequential
from keras.layers import Dense, Dropout, Flatten, Conv2D, MaxPooling2D
from keras.utils import to_categorical
from keras.callbacks import EarlyStopping, ModelCheckpoint, CSVLogger
from keras.optimizers import *
from keras import regularizers
"""
# Classe permettant d'entrainer un modèle sur une jeu de données
"""
def get_labels(path):
"""
# Permet de recuperer les labels de nos classe, leurs indices dans le tableau et leur matrix binaire one hot encoder
:param path: chemin ou sont stocké nos fichiers Numpy
"""
labels = [file.replace('.npy', '') for file in os.listdir(path) if file.endswith('.npy')]
label_indices = np.arange(0, len(labels))
return labels, label_indices, to_categorical(label_indices)
def get_train_test(train_ratio, pathData):
"""
# Retourner le dataset melanger en dataset d'entrainement et de validation selon un ratio
:param train_ratio: permet de gerer la part entre dataset de train et de validation
:param pathData: chemin des fichiers numpy
"""
labels, _, _ = get_labels(pathData)
classNumber = 0
#On init avec le premier tableau pour avoir les bonnes dimensions pour la suite
X = data = np.load(pathData + '\\' + labels[0] + '.npy')
Y = np.zeros(X.shape[0])
dimension = X[0].shape
classNumber += 1
#On ajoute le reste des fichiers numpy de nos classes
for i, label in enumerate(labels[1:]):
data = np.load(pathData + '\\' + label + '.npy')
X = np.vstack((X, data))
Y = np.append(Y, np.full(data.shape[0], fill_value=(i+1)))
classNumber += 1
X_train, X_test, Y_train, Y_test = train_test_split(X, Y, train_size=train_ratio)
return X_train, X_test, to_categorical(Y_train), to_categorical(Y_test), classNumber, dimension
def main():
"""
# Fonction main
"""
#Definition des chemins et autres variables
pathData = '.\\numpy'
trainRatio = 0.8
epochs = 1000
batch_size = 16
earlyStopPatience = 5
#Definition des callbacks
#Permet de retourner 4 metrics de suivi a chaque iteration
csv_logger = CSVLogger('.\\logs\\log_moModel.csv', append=True, separator=',')
#Permet de stopper l'entrainement quand le modèle n'entraine pluss
early = EarlyStopping(monitor='val_loss', min_delta=0, patience=earlyStopPatience, verbose=0, mode='auto')
#Permet de sauvegarder le model a chaque iteration si il est meilleur que le precedent
check = ModelCheckpoint('.\\trainedModel\\moModel.hdf5', monitor='val_loss', verbose=0,
save_best_only=True, save_weights_only=False, mode='auto')
#Recuperation de nos data pré traité
x_train, x_test, y_train, y_test, classNumber, dimension = get_train_test(trainRatio, pathData)
#On verifie les dimensions de nos données
print('DIMENSION X TRAIN ' + str(x_train.shape))
print('DIMENSION X TEST ' + str(x_test.shape))
print('DIMENSION Y TRAIN ' + str(y_train.shape))
print('DIMENSION Y TEST ' + str(y_test.shape))
#On creer le modele
model = Sequential()
model.add(Conv2D(32, kernel_size=(2, 2), activation='relu', input_shape=(dimension[0], dimension[1], dimension[2])))
model.add(MaxPooling2D(pool_size=(2, 2)))
model.add(Dropout(0.25))
model.add(Flatten())
model.add(Dense(128, activation='relu'))
model.add(Dropout(0.25))
model.add(Dense(classNumber, activation='softmax'))
#On compile le modele
model.compile(loss=keras.losses.categorical_crossentropy,
optimizer=keras.optimizers.Adamax(lr=0.001, beta_1=0.9, beta_2=0.999, decay=0.0),
metrics=['accuracy'])
#On lance l'entrainement du modele
trainning = model.fit(x_train, y_train, batch_size=batch_size, epochs=epochs, validation_data=(x_test, y_test), callbacks=[early, check,csv_logger])
if __name__ == "__main__":
"""
# MAIN
"""
main()