Add new file

feat: adding resnet and formatting updates
Update .gitlab-ci.yml file
2024-03-31 18:12:02 +00:00 · 2023-04-06 00:37:59 -04:00 · 2022-07-09 19:07:02 +00:00 · 2022-06-07 19:33:40 -04:00 · 2022-06-03 15:59:18 -04:00 · 2022-06-03 13:55:06 -04:00
967 changed files with 534 additions and 1438 deletions
@@ -0,0 +1,45 @@
 # This file is a template, and might need editing before it works on your project.
 # To contribute improvements to CI/CD templates, please follow the Development guide at:
 # https://docs.gitlab.com/ee/development/cicd/templates.html
 # This specific template is located at:
 # https://gitlab.com/gitlab-org/gitlab/-/blob/master/lib/gitlab/ci/templates/Getting-Started.gitlab-ci.yml
 # This is a sample GitLab CI/CD configuration file that should run without any modifications.
 # It demonstrates a basic 3 stage CI/CD pipeline. Instead of real tests or scripts,
 # it uses echo commands to simulate the pipeline execution.
 #
 # A pipeline is composed of independent jobs that run scripts, grouped into stages.
 # Stages run in sequential order, but jobs within stages run in parallel.
 #
 # For more information, see: https://docs.gitlab.com/ee/ci/yaml/index.html#stages
 stages:          # List of stages for jobs, and their order of execution
  - build
  - test
  - deploy
 build-job:       # This job runs in the build stage, which runs first.
  stage: build
  script:
    - echo "Compiling the code..."
    - echo "Compile complete."
 unit-test-job:   # This job runs in the test stage.
  stage: test    # It only starts when the job in the build stage completes successfully.
  script:
    - echo "Running unit tests... This will take about 60 seconds."
    - sleep 60
    - echo "Code coverage is 90%"
 lint-test-job:   # This job also runs in the test stage.
  stage: test    # It can run at the same time as unit-test-job (in parallel).
  script:
    - echo "Linting code... This will take about 10 seconds."
    - sleep 10
    - echo "No lint issues found."
 deploy-job:      # This job runs in the deploy stage.
  stage: deploy  # It only runs when *both* jobs in the test stage complete successfully.
  script:
    - echo "Deploying application..."
    - echo "Application successfully deployed."
@@ -5,6 +5,9 @@ import json
 from pprint import pprint
 from google_images_download import google_images_download
 total_per = 10
 form_increment = 1
 def create_forms_dict(df):
    poke_dict = {}
@@ -39,22 +42,26 @@ def process_pokemon_names(df):
    pprint(poke_dict)
    pokes_to_limits = []
    for pokemon, form_list in poke_dict.items():
        if len(form_list) == 0:
        print(pokemon)
-            pokes_to_limits.append((pokemon, 200))
+        num_forms = len(form_list)
        if num_forms == 0:
            pokes_to_limits.append((pokemon, total_per))
-        elif len(form_list) == 1:
+        elif num_forms == 1:
-            pokes_to_limits.append((pokemon, 150))
+            pokes_to_limits.append((pokemon, total_per - form_increment))
-            pokes_to_limits.append((search_term(form_list[0]), 50))
+            pokes_to_limits.append((search_term(form_list[0]), form_increment))
-        elif len(form_list) == 2:
+        elif num_forms == 2:
-            pokes_to_limits.append((pokemon, 100))
+            pokes_to_limits.append((pokemon, total_per - form_increment * num_forms))
            for form in form_list:
-                pokes_to_limits.append((search_term(form), 50))
+                pokes_to_limits.append((search_term(form), form_increment))
-        elif len(form_list) >= 3:
+        elif num_forms >= 3:
            revised_increment = int(total_per / len(form_list))
            for form in form_list:
-                pokes_to_limits.append((search_term(form), int(200 / len(form_list))))
+                pokes_to_limits.append((pokemon, total_per - revised_increment * num_forms))
                pokes_to_limits.append((search_term(form), revised_increment))
    return pokes_to_limits
@@ -7,9 +7,7 @@ import multiprocessing
 import json
 import shutil
 from pathlib import Path
 from PIL import Image
 from pprint import pprint
 from random import randint
 from threading import Lock
@@ -1,12 +1,13 @@
 import os
 from random import random
-from shutil import copyfile, rmtree
+from shutil import rmtree
 from pathlib import Path
 import multiprocessing
 train_dir = "./data/train/"
 test_dir = "./data/test/"
 val_dir = "./data/val/"
 train = .80
 test = .10
 val = .10
@@ -1,189 +0,0 @@
 import keras
 import matplotlib.pyplot as plt
 import numpy as np
 import pandas as pd
 import seaborn as sn
 from keras import optimizers
 from keras.applications import inception_v3, mobilenet_v2, vgg16
 from keras.applications.inception_v3 import preprocess_input
 from keras.callbacks import ModelCheckpoint, EarlyStopping, TensorBoard
 from keras.layers import Dense, Dropout, GlobalAveragePooling2D
 from keras.models import Sequential
 from keras.preprocessing.image import ImageDataGenerator
 from sklearn.metrics import accuracy_score, confusion_matrix, classification_report
 from time import time
 from PIL import ImageFile
 # First we some globals that we want to use for this entire process
 ImageFile.LOAD_TRUNCATED_IMAGES = True
 input_shape = (224, 224, 3)
 batch_size = 96
 model_name = "mobilenet-fixed-data"
 # Next we set up the Image Data Generators to feed into the training cycles.
 # We need one for training, validation, and testing
 train_idg = ImageDataGenerator(
    horizontal_flip=True,
    rotation_range=30,
    width_shift_range=[-.1, .1],
    height_shift_range=[-.1, .1],
    preprocessing_function=preprocess_input
 )
 train_gen = train_idg.flow_from_directory(
    './data/train',
    target_size=(input_shape[0], input_shape[1]),
    batch_size=batch_size
 )
 print(len(train_gen.classes))
 val_idg = ImageDataGenerator(
    horizontal_flip=True,
    rotation_range=30,
    width_shift_range=[-.1, .1],
    height_shift_range=[-.1, .1],
    preprocessing_function=preprocess_input
 )
 val_gen = val_idg.flow_from_directory(
    './data/val',
    target_size=(input_shape[0], input_shape[1]),
    batch_size=batch_size
 )
 test_idg = ImageDataGenerator(
    preprocessing_function=preprocess_input,
 )
 test_gen = test_idg.flow_from_directory(
    './data/test',
    target_size=(input_shape[0], input_shape[1]),
    batch_size=batch_size,
    shuffle=False
 )
 # Now we define the model we are going to use....to use something differnet just comment it out or add it here
 # base_model = vgg16.VGG16(
 #     weights='imagenet',
 #     include_top=False,
 #     input_shape=input_shape
 # )
 # base_model = inception_v3.InceptionV3(
 #     weights='imagenet',
 #     include_top=False,
 #     input_shape=input_shape
 # )
 base_model = mobilenet_v2.MobileNetV2(
    # weights='imagenet',
    include_top=False,
    input_shape=input_shape
 )
 # Create a new top for that model
 add_model = Sequential()
 add_model.add(base_model)
 add_model.add(GlobalAveragePooling2D())
 # add_model.add(Dense(4048, activation='relu'))
 # add_model.add(Dropout(0.5))
 add_model.add(Dense(2024, activation='relu'))
 # Adding some dense layers in order to learn complex functions from the base model
 add_model.add(Dropout(0.5))
 add_model.add(Dense(512, activation='relu'))
 add_model.add(Dense(len(train_gen.class_indices), activation='softmax'))  # Decision layer
 model = add_model
 model.compile(loss='categorical_crossentropy',
              # optimizer=optimizers.SGD(lr=1e-4, momentum=0.9),
              optimizer=optimizers.Adam(lr=1e-4),
              metrics=['accuracy'])
 model.summary()
 print(
    model.output_shape
 )
 # Now that the model is created we can go ahead and train on it using the image generators we created earlier
 file_path = model_name + ".hdf5"
 checkpoint = ModelCheckpoint(file_path, monitor='val_acc', verbose=1, save_best_only=True, mode='max')
 early = EarlyStopping(monitor="val_acc", mode="max", patience=15)
 tensorboard = TensorBoard(
    log_dir="logs/" + model_name + "{}".format(time()), histogram_freq=0, batch_size=batch_size,
    write_graph=True,
    write_grads=True,
    write_images=True,
    update_freq=batch_size
 )
 callbacks_list = [checkpoint, early, tensorboard]  # early
 history = model.fit_generator(
    train_gen,
    validation_data=val_gen,
    steps_per_epoch=len(train_gen),
    validation_steps=len(val_gen),
    epochs=25,
    shuffle=True,
    verbose=True,
    callbacks=callbacks_list
 )
 # Finally we are going to grab predictions from our model, save it, and then run some analysis on the results
 predicts = model.predict_generator(test_gen, verbose=True, workers=1, steps=len(test_gen))
 keras_file = model_name + 'finished.h5'
 keras.models.save_model(model, keras_file)
 print(predicts)
 print(type(predicts))
 print(predicts.shape)
 # Process the predictions
 predicts = np.argmax(predicts,
                     axis=1)
 # test_gen.reset()
 label_index = {v: k for k, v in train_gen.class_indices.items()}
 predicts = [label_index[p] for p in predicts]
 reals = [label_index[p] for p in test_gen.classes]
 # Save the results
 print(label_index)
 print(test_gen.classes)
 print(test_gen.classes.shape)
 print(type(test_gen.classes))
 df = pd.DataFrame(columns=['fname', 'prediction', 'true_val'])
 df['fname'] = [x for x in test_gen.filenames]
 df['prediction'] = predicts
 df["true_val"] = reals
 df.to_csv("sub1_non_transfer.csv", index=False)
 # Processed the saved results
 acc = accuracy_score(reals, predicts)
 conf_mat = confusion_matrix(reals, predicts)
 print(classification_report(reals, predicts, [l for l in label_index.values()]))
 print("Testing accuracy score is ", acc)
 print("Confusion Matrix", conf_mat)
 df_cm = pd.DataFrame(conf_mat, index=[i for i in list(set(reals))],
                     columns=[i for i in list(set(reals))])
 plt.figure(figsize=(10, 7))
 sn.heatmap(df_cm, annot=True)
 plt.show()
 with open("labels.txt", "w") as f:
    for label in label_index.values():
        f.write(label + "\n")
@@ -1,123 +0,0 @@
 from time import time
 import matplotlib.pyplot as plt
 import numpy as np
 import pandas as pd
 import seaborn as sn
 from PIL import ImageFile
 from tensorflow import keras
 from model_builders import ImageClassModelBuilder, ImageClassModels
 ImageFile.LOAD_TRUNCATED_IMAGES = True
 input_shape = (224, 224, 3)
 batch_size = 32
 model_name = f"mobilenetv2-dense1024-l1l2-25drop-{time()}"
 training_idg = keras.preprocessing.image.ImageDataGenerator(
    horizontal_flip=True,
    rotation_range=30,
    width_shift_range=[-.1, .1],
    height_shift_range=[-.1, .1],
 )
 testing_idg = keras.preprocessing.image.ImageDataGenerator(
    horizontal_flip=True,
 )
 def get_gen(path, test_set=False):
    idg = testing_idg if test_set else training_idg
    return idg.flow_from_directory(
        path,
        target_size=(input_shape[0], input_shape[1]),
        batch_size=batch_size,
        class_mode='categorical',
        shuffle=True,
        color_mode='rgb'
    )
 def train_model(train_gen, val_gen):
    model = ImageClassModelBuilder(
        input_shape=input_shape,
        n_classes=807,
        optimizer=keras.optimizers.Adam(learning_rate=.0001),
        pre_trained=True,
        fine_tune=0,
        base_model=ImageClassModels.MOBILENET_V2
    ).create_model()
    # Train the model
    checkpoint = keras.callbacks.ModelCheckpoint(f"./Models/keras/{model_name}.hdf5", monitor='val_loss', verbose=1,
                                                 save_best_only=True,
                                                 mode='min')
    early = keras.callbacks.EarlyStopping(monitor="loss", mode="min", patience=15)
    tensorboard = keras.callbacks.TensorBoard(
        log_dir="logs/" + model_name,
        histogram_freq=1,
        write_graph=True,
        write_images=True,
        update_freq=1,
        profile_batch=2,
        embeddings_freq=1,
    )
    callbacks_list = [checkpoint, early, tensorboard]
    history = model.fit(
        train_gen,
        validation_data=val_gen,
        epochs=100,
        batch_size=batch_size,
        shuffle=True,
        verbose=True,
        workers=12,
        callbacks=callbacks_list,
        max_queue_size=1000
    )
    print(history)
    return model
 def test_model(model, test_gen):
    print(len(test_gen.filenames))
    score = model.evaluate(test_gen, workers=8, steps=len(test_gen))
    predicts = model.predict(test_gen, verbose=True, workers=8, steps=len(test_gen))
    print("Loss: ", score[0], "Accuracy: ", score[1])
    print(score)
    print(predicts)
    print(type(predicts))
    print(predicts.shape)
    # Process the predictions
    predicts = np.argmax(predicts,
                         axis=1)
    label_index = {v: k for k, v in test_gen.class_indices.items()}
    predicts = [label_index[p] for p in predicts]
    reals = [label_index[p] for p in test_gen.classes]
    # Save the results
    df = pd.DataFrame(columns=['fname', 'prediction', 'true_val'])
    df['fname'] = [x for x in test_gen.filenames]
    df['prediction'] = predicts
    df["true_val"] = reals
    df.to_csv("sub1.csv", index=False)
    # Processed the saved results
    from sklearn.metrics import accuracy_score, confusion_matrix
    acc = accuracy_score(reals, predicts)
    conf_mat = confusion_matrix(reals, predicts)
    print("Testing accuracy score is ", acc)
    print("Confusion Matrix", conf_mat)
    df_cm = pd.DataFrame(conf_mat, index=[i for i in list(set(reals))],
                         columns=[i for i in list(set(reals))])
    plt.figure(figsize=(10, 7))
    sn.heatmap(df_cm, annot=True)
    plt.show()
 if __name__ == "__main__":
    train_gen = get_gen('./data/train')
    val_gen = get_gen('./data/val')
    test_gen = get_gen('./data/test', test_set=True)
    model = train_model(train_gen, val_gen)
    test_model(model, test_gen)
@@ -0,0 +1,197 @@
 from enum import Enum
 import matplotlib.pyplot as plt
 import numpy as np
 from PIL import ImageFile
 from sklearn.metrics import accuracy_score, confusion_matrix, classification_report
 from tensorflow import keras
 from modeling_utils import ImageClassModelBuilder, ImageClassModels
 ImageFile.LOAD_TRUNCATED_IMAGES = True
 input_shape = (224, 224, 3)
 batch_size = 32
 training_idg = keras.preprocessing.image.ImageDataGenerator(
    horizontal_flip=True,
    rotation_range=30,
    width_shift_range=[-.1, .1],
    height_shift_range=[-.1, .1],
 )
 val_idg = keras.preprocessing.image.ImageDataGenerator(
    horizontal_flip=True,
 )
 testing_idg = keras.preprocessing.image.ImageDataGenerator(
    horizontal_flip=True,
 )
 class DatasetType(Enum):
    TRAIN = 0
    TEST = 1
    VAL = 2
 def get_gen(path, dataset_type: DatasetType = DatasetType.TRAIN):
    idg = None
    if dataset_type is DatasetType.TRAIN:
        idg = training_idg
    if dataset_type is DatasetType.TEST:
        idg = testing_idg
    if dataset_type is DatasetType.VAL:
        idg = val_idg
    return idg.flow_from_directory(
        path,
        target_size=(input_shape[0], input_shape[1]),
        batch_size=batch_size,
        class_mode='categorical',
        shuffle=True,
        color_mode='rgb'
    )
 def train_model(model, model_name, train_gen, val_gen, max_epochs):
    print(model)
    print(f"NOW TRAINING: {model_name}")
    checkpoint = keras.callbacks.ModelCheckpoint(
        f"./models/keras/{model_name}.hdf5",
        monitor='val_categorical_crossentropy',
        verbose=1,
        save_best_only=True,
        mode='min'
    )
    early = keras.callbacks.EarlyStopping(
        monitor="val_categorical_crossentropy",
        mode="auto",
        patience=4,
        restore_best_weights=True,
        verbose=1,
    )
    tensorboard = keras.callbacks.TensorBoard(
        log_dir="logs/" + model_name,
        histogram_freq=1,
        write_graph=True,
        write_images=True,
        update_freq=1,
        profile_batch=2,
        embeddings_freq=1,
    )
    model.fit(
        train_gen,
        validation_data=val_gen,
        epochs=max_epochs,
        batch_size=batch_size,
        shuffle=True,
        verbose=True,
        workers=20,
        callbacks=[checkpoint, early, tensorboard],
        max_queue_size=1000
    )
    return model
 def test_model(model, test_gen):
    predictions = model.predict(test_gen, verbose=True, workers=1, steps=len(test_gen))
    print(predictions)
    print(type(predictions))
    print(predictions.shape)
    # Process the predictions
    predictions = np.argmax(predictions,
                            axis=1)
    # test_gen.reset()
    label_index = {v: k for k, v in test_gen.class_indices.items()}
    predictions = [label_index[p] for p in predictions]
    reals = [label_index[p] for p in test_gen.classes]
    # Processed the saved results
    acc = accuracy_score(reals, predictions)
    conf_mat = confusion_matrix(reals, predictions)
    print(classification_report(reals, predictions, labels=[l for l in label_index.values()]))
    print("Testing accuracy score is ", acc)
    print("Confusion Matrix", conf_mat)
    print("made dataframe")
    plt.figure(figsize=(10, 7))
    print("made plot")
    print("showing plot")
    plt.show()
 if __name__ == "__main__":
    model_builders = [
        ImageClassModelBuilder(
            input_shape=input_shape,
            n_classes=807,
            optimizer=keras.optimizers.Adam(learning_rate=.0001),
            pre_trained=True,
            freeze_layers=True,
            freeze_batch_norm=True,
            base_model_type=ImageClassModels.MOBILENET_V2,
            dense_layer_neurons=1024,
            dropout_rate=.5,
        ),        ImageClassModelBuilder(
            input_shape=input_shape,
            n_classes=807,
            optimizer=keras.optimizers.Adam(learning_rate=.0001),
            pre_trained=True,
            freeze_layers=True,
            freeze_batch_norm=True,
            base_model_type=ImageClassModels.INCEPTION_RESNET_V2,
            dense_layer_neurons=1024,
            dropout_rate=.5,
        ),        ImageClassModelBuilder(
            input_shape=input_shape,
            n_classes=807,
            optimizer=keras.optimizers.Adam(learning_rate=.0001),
            pre_trained=True,
            freeze_layers=True,
            freeze_batch_norm=True,
            base_model_type=ImageClassModels.INCEPTION_V3,
            dense_layer_neurons=1024,
            dropout_rate=.5,
        ),        ImageClassModelBuilder(
            input_shape=input_shape,
            n_classes=807,
            optimizer=keras.optimizers.Adam(learning_rate=.0001),
            pre_trained=True,
            freeze_layers=True,
            freeze_batch_norm=True,
            base_model_type=ImageClassModels.XCEPTION,
            dense_layer_neurons=1024,
            dropout_rate=.5,
        ),        ImageClassModelBuilder(
            input_shape=input_shape,
            n_classes=807,
            optimizer=keras.optimizers.Adam(learning_rate=.0001),
            pre_trained=True,
            freeze_layers=True,
            freeze_batch_norm=True,
            base_model_type=ImageClassModels.DENSENET201,
            dense_layer_neurons=1024,
            dropout_rate=.5,
        )
    ]
    for mb in model_builders:
        model = mb.create_model()
        model_name = mb.get_name()
        train_gen = get_gen('./data/train', dataset_type=DatasetType.TRAIN)
        val_gen = get_gen('./data/val', dataset_type=DatasetType.VAL)
        test_gen = get_gen('./data/test', dataset_type=DatasetType.TEST)
        model = train_model(model, model_name, train_gen, val_gen, 1)
        # for layer in model.layers[2].layers:
        #     if not isinstance(layer, keras.layers.BatchNormalization):
        #         layer.trainable = True
        # model.layers[2].trainable = True
        # print(model)
        # model.compile(
        #     optimizer=keras.optimizers.Adam(learning_rate=.00001),
        #     loss=keras.losses.CategoricalCrossentropy(),
        #     metrics=['accuracy', 'categorical_crossentropy']
        # )
        # model.summary()
        # model = train_model(model, model_name + "-second_stage", train_gen, val_gen, 1)
        # test_model(model, test_gen)
@@ -1,78 +0,0 @@
 import pandas as pd
 import matplotlib.pyplot as plt
 import seaborn as sn
 import numpy as np
 from keras.applications.inception_v3 import preprocess_input
 from keras.preprocessing.image import ImageDataGenerator
 from keras.models import load_model
 from sklearn.metrics import accuracy_score, confusion_matrix, classification_report
 from PIL import ImageFile
 ImageFile.LOAD_TRUNCATED_IMAGES = True
 model = load_model("./Models/mobilenetv2-stock-all-fixed-v2/mobilenetv2.hdf5")
 input_shape = (224, 224, 3)
 batch_size = 96
 test_idg = ImageDataGenerator(
    preprocessing_function=preprocess_input,
 )
 test_gen = test_idg.flow_from_directory(
    # './data/test',
    './SingleImageTestSet',
    target_size=(input_shape[0], input_shape[1]),
    batch_size=batch_size,
    shuffle=False
 )
 predictions = model.predict_generator(test_gen, verbose=True, workers=1, steps=len(test_gen))
 print(predictions)
 print(type(predictions))
 print(predictions.shape)
 # Process the predictions
 predictions = np.argmax(predictions,
                        axis=1)
 # test_gen.reset()
 label_index = {v: k for k, v in test_gen.class_indices.items()}
 predictions = [label_index[p] for p in predictions]
 reals = [label_index[p] for p in test_gen.classes]
 # Save the results
 print(label_index)
 print(test_gen.classes)
 print(test_gen.classes.shape)
 print(type(test_gen.classes))
 df = pd.DataFrame(columns=['fname', 'prediction', 'true_val'])
 df['fname'] = [x for x in test_gen.filenames]
 df['prediction'] = predictions
 df["true_val"] = reals
 df.to_csv("sub1_non_transfer.csv", index=False)
 # Processed the saved results
 acc = accuracy_score(reals, predictions)
 conf_mat = confusion_matrix(reals, predictions)
 print(classification_report(reals, predictions, labels=[l for l in label_index.values()]))
 print("Testing accuracy score is ", acc)
 print("Confusion Matrix", conf_mat)
 df_cm = pd.DataFrame(conf_mat, index=[i for i in list(set(reals))],
                     columns=[i for i in list(set(reals))])
 print("made dataframe")
 plt.figure(figsize=(10, 7))
 print("made plot")
 # sn.heatmap(df_cm, annot=True)
 print("showing plot")
 plt.show()
 with open("labels.txt", "w") as f:
    for label in label_index.values():
        f.write(label + "\n")
@@ -0,0 +1,61 @@
 from glob import glob
 import matplotlib.pyplot as plt
 import pandas as pd
 from PIL import ImageFile
 from keras.models import load_model
 from keras.preprocessing.image import ImageDataGenerator
 from modeling_utils import get_metrics
 ImageFile.LOAD_TRUNCATED_IMAGES = True
 accuracies = []
 losses = []
 filenames = []
 input_shape = (224, 224, 3)
 batch_size = 32
 metrics_df = pd.read_csv("all_model_output.csv")
 test_gen = ImageDataGenerator().flow_from_directory(
    './data/test',
    target_size=(input_shape[0], input_shape[1]),
    batch_size=batch_size,
    shuffle=False
 )
 single_gen = ImageDataGenerator().flow_from_directory(
    './single_image_test_set',
    target_size=(input_shape[0], input_shape[1]),
    batch_size=batch_size,
    shuffle=False
 )
 for file in glob("./models/keras/*.hdf5"):
    print(file)
    if file in metrics_df.values:
        continue
    model = load_model(file)
    test_acc, test_ll = get_metrics(test_gen, model)
    single_acc, single_ll = get_metrics(single_gen, model, file[:-5] + ".csv")
    metrics_df = metrics_df.append({
        "model": file,
        "test_acc": test_acc,
        "test_loss": test_ll,
        "single_acc": single_acc,
        "single_loss": single_ll,
    }, ignore_index=True)
 # Save the results
 metrics_df.to_csv("all_model_output.csv", index=False)
 print(metrics_df)
 metrics_df = metrics_df.sort_values('single_acc')
 metrics_df.plot.bar(y=["test_acc", "single_acc"], rot=90)
 metrics_df = metrics_df.sort_values('test_acc')
 metrics_df.plot.bar(y=["test_acc", "single_acc"], rot=90)
 plt.tight_layout()
 plt.show()
@@ -1,11 +0,0 @@
 import tensorflow as tf
 from tensorflow import keras
 keras_file = "mobilenetv2.hdf5"
 keras.models.load_model(keras_file)
 h5_model = keras.models.load_model(keras_file)
 converter = tf.lite.TFLiteConverter.from_keras_model_file(keras_file)
 tflite_model = converter.convert()
 with open('mobilenetv2.tflite', 'wb') as f:
    f.write(tflite_model)
@@ -0,0 +1,43 @@
 import os
 from glob import glob
 from pathlib import Path
 import pandas as pd
 import tensorflow as tf
 from keras.preprocessing.image import ImageDataGenerator
 import tensorflow as tf
 # TODO: Move these to a config for the project
 input_shape = (224, 224, 3)
 batch_size = 32
 single_gen = ImageDataGenerator().flow_from_directory(
    './single_image_test_set',
    target_size=(input_shape[0], input_shape[1]),
    batch_size=batch_size,
    shuffle=False
 )
 pd.DataFrame(sorted([f.name for f in os.scandir("./data/train") if f.is_dir()])).to_csv("./models/tflite/labels.txt",
                                                                                        index=False, header=False)
 for file in glob("./models/keras/*.hdf5"):
    path = Path(file)
    tflite_file = f'./models/tflite/models/{path.name[:-5] + ".tflite"}'
    if not Path(tflite_file).exists():
        print(tflite_file)
        keras_model = tf.keras.models.load_model(file)
        keras_model.summary()
        print(keras_model.input)
        print(keras_model.layers)
        converter = tf.lite.TFLiteConverter.from_keras_model(keras_model)
        tflite_model = converter.convert()
        with open(tflite_file, 'wb') as f:
            f.write(tflite_model)
    # TODO: Verify the model performance after converting to TFLITE
    # interpreter = tf.lite.Interpreter(model_path=tflite_file)
    # single_acc, single_ll = get_metrics(single_gen, keras_model)
    # tf_single_acc, tf_single_ll = get_metrics(single_gen, tflite_model)
    #
    # print(single_acc, tf_single_acc)
    # print(single_ll, tf_single_ll)
@@ -1,4 +0,0 @@
 import pandas as pd
 import os
 pd.DataFrame(sorted([f.name for f in os.scandir("./data/train") if f.is_dir()])).to_csv("labels.txt", index=False, header=False)
@@ -0,0 +1 @@
 Test readme file
@@ -0,0 +1,7 @@
 model,test_acc,test_loss,single_acc,single_loss
 ./models/keras\pt-fl-fbn-efficientnet_v2b0-d1024-do0.5-l11.e-04-l21.e-04-5224-second_stage.hdf5,0.6720150708068079,1.7423864365349095,0.9893048128342246,0.4364729183409372
 ./models/keras\pt-fl-fbn-efficientnet_v2b0-d1024-do0.5-l11.e-04-l21.e-04-5224.hdf5,0.410029881772119,3.346152696366266,0.986096256684492,0.3234976000776315
 ./models/keras\pt-fl-fbn-efficientnet_v2s-d1024-do0.5-l11.e-04-l21.e-04-8105-second_stage.hdf5,0.6850721060153306,1.675868156533777,0.9967914438502674,0.3373779159304851
 ./models/keras\pt-fl-fbn-efficientnet_v2s-d1024-do0.5-l11.e-04-l21.e-04-8105.hdf5,0.3755359230869169,3.5500588697038067,0.9540106951871656,0.4727042578503783
 ./models/keras\pt-fl-fbn-efficientnet_v2s-d1024-do0.5-l11.e-04-l21.e-04-9317-second_stage.hdf5,0.6121780461172843,2.197206965588216,0.9946581196581196,0.2974041509252359
 ./models/keras\pt-fl-fbn-efficientnet_v2s-d1024-do0.5-l11.e-04-l21.e-04-9317.hdf5,0.3702228787976106,3.601324427207316,0.9594017094017094,0.4877960320956891
@@ -1,76 +0,0 @@
 from enum import Enum
 from typing import Tuple
 import tensorflow as tf
 from tensorflow import keras
 from .modelwrapper import ModelWrapper
 class ImageClassModels(Enum):
    INCEPTION_V3 = ModelWrapper(
        keras.applications.InceptionV3,
        keras.applications.inception_v3.preprocess_input
    )
    XCEPTION = ModelWrapper(
        keras.applications.xception.Xception,
        keras.applications.inception_v3.preprocess_input
    )
    MOBILENET_V2 = ModelWrapper(
        keras.applications.mobilenet_v2.MobileNetV2,
        keras.applications.mobilenet_v2.preprocess_input
    )
 class ImageClassModelBuilder(object):
    def __init__(self,
                 input_shape: Tuple[int, int, int],
                 n_classes: int,
                 optimizer: tf.keras.optimizers.Optimizer = keras.optimizers.Adam(
                     learning_rate=.0001),
                 pre_trained: bool = True,
                 fine_tune: int = 0,
                 base_model: ImageClassModels = ImageClassModels.MOBILENET_V2):
        self.input_shape = input_shape
        self.n_classes = n_classes
        self.optimizer = optimizer
        self.pre_trained = pre_trained
        self.fine_tune = fine_tune
        self.base_model = base_model
    def set_base_model(self, base_model: ImageClassModels):
        self.base_model = base_model
    def create_model(self):
        base_model = self.base_model.value.model_func(
            weights='imagenet' if self.pre_trained else None,
            include_top=False
        )
        if self.pre_trained:
            if self.fine_tune > 0:
                for layer in base_model.layers[:-self.fine_tune]:
                    layer.trainable = False
            else:
                for layer in base_model.layers:
                    layer.trainable = False
        i = tf.keras.layers.Input([self.input_shape[0], self.input_shape[1], self.input_shape[2]], dtype=tf.float32)
        x = tf.cast(i, tf.float32)
        x = self.base_model.value.model_preprocessor(x)
        x = base_model(x)
        x = keras.layers.GlobalAveragePooling2D()(x)
        x = keras.layers.Dense(1024, activation='relu', kernel_regularizer=keras.regularizers.L1L2(l1=1e-5, l2=1e-5))(x)
        x = keras.layers.Dropout(0.25)(x)
        output = keras.layers.Dense(self.n_classes, activation='softmax')(x)
        model = keras.Model(inputs=i, outputs=output)
        model.compile(optimizer=self.optimizer,
                      loss=keras.losses.CategoricalCrossentropy(),
                      metrics=[
                          'accuracy',
                          # 'mse'
                      ])
        model.summary()
        return model
@@ -1 +1,2 @@
 from .image_class_builder import ImageClassModelBuilder, ImageClassModels
 from .model_testing import get_metrics
@@ -0,0 +1,125 @@
 import random
 from enum import Enum
 from typing import Tuple
 import numpy as np
 import tensorflow as tf
 from tensorflow import keras
 from .model_wrapper import ModelWrapper
 class ImageClassModels(Enum):
    INCEPTION_V3 = ModelWrapper(
        keras.applications.inception_v3.InceptionV3,
        keras.applications.inception_v3.preprocess_input,
        "inception_v3"
    )
    INCEPTION_RESNET_V2 = ModelWrapper(
        keras.applications.inception_resnet_v2.InceptionResNetV2,
        keras.applications.inception_resnet_v2.preprocess_input,
        "inception_resnet_v2"
    )
    XCEPTION = ModelWrapper(
        keras.applications.xception.Xception,
        keras.applications.xception.preprocess_input,
        "xception"
    )
    DENSENET201 = ModelWrapper(
        keras.applications.densenet.DenseNet201,
        keras.applications.densenet.preprocess_input,
        "densenet201"
    )
    MOBILENET_V2 = ModelWrapper(
        keras.applications.mobilenet_v2.MobileNetV2,
        keras.applications.mobilenet_v2.preprocess_input,
        "mobilenet_v2"
    )
    EFFICIENTNET_V2S = ModelWrapper(
        keras.applications.efficientnet_v2.EfficientNetV2S,
        tf.keras.applications.efficientnet_v2.preprocess_input,
        "efficientnet_v2s"
    )
    EFFICIENTNET_V2B0 = ModelWrapper(
        keras.applications.efficientnet_v2.EfficientNetV2B0,
        tf.keras.applications.efficientnet_v2.preprocess_input,
        "efficientnet_v2b0"
    )
 class ImageClassModelBuilder(object):
    def __init__(self,
                 input_shape: Tuple[int, int, int],
                 n_classes: int,
                 optimizer: tf.keras.optimizers.Optimizer = keras.optimizers.Adam(
                     learning_rate=.0001),
                 pre_trained: bool = True,
                 freeze_batch_norm: bool = False,
                 freeze_layers: bool = False,
                 base_model_type: ImageClassModels = ImageClassModels.MOBILENET_V2,
                 dense_layer_neurons: int = 1024,
                 dropout_rate: float = .5,
                 l1: float = 1e-4,
                 l2: float = 1e-4):
        self.input_shape = input_shape
        self.n_classes = n_classes
        self.optimizer = optimizer
        self.pre_trained = pre_trained
        self.freeze_layers = freeze_layers
        self.freeze_batch_norm = freeze_batch_norm
        self.dense_layer_neurons = dense_layer_neurons
        self.dropout_rate = dropout_rate
        self.l1 = l1
        self.l2 = l2
        self.set_base_model(base_model_type)
    def set_base_model(self, base_model_type: ImageClassModels):
        self.base_model_type = base_model_type
        self.base_model = self.base_model_type.value.model_func(
            weights='imagenet' if self.pre_trained else None,
            input_shape=self.input_shape,
            include_top=False
        )
    def create_model(self):
        if self.freeze_layers:
            self.base_model.trainable = False
        if self.freeze_batch_norm:
            for layer in self.base_model.layers:
                if isinstance(layer, keras.layers.BatchNormalization):
                    layer.trainable = False
        i = tf.keras.layers.Input([self.input_shape[0], self.input_shape[1], self.input_shape[2]], dtype=tf.float32)
        x = tf.cast(i, tf.float32)
        x = self.base_model_type.value.model_preprocessor(x)
        x = self.base_model(x)
        x = keras.layers.GlobalAveragePooling2D()(x)
        x = keras.layers.Dense(self.dense_layer_neurons, activation='relu',
                               kernel_regularizer=keras.regularizers.L1L2(l1=self.l1, l2=self.l2))(x)
        x = keras.layers.Dropout(self.dropout_rate)(x)
        output = keras.layers.Dense(self.n_classes, activation='softmax')(x)
        self.model = keras.Model(inputs=i, outputs=output)
        self.model.compile(
            optimizer=self.optimizer,
            loss=keras.losses.CategoricalCrossentropy(),
            metrics=['accuracy', 'categorical_crossentropy']
        )
        self.model.summary()
        return self.model
    def get_fine_tuning(self):
        print("self.model is found")
        self.base_model.trainable = True
        self.model.compile(
            optimizer=self.optimizer,
            loss=keras.losses.CategoricalCrossentropy(),
            metrics=['accuracy', 'categorical_crossentropy']
        )
        self.model.summary()
        return self.model
    def get_name(self):
        return f"{'pt-' if self.pre_trained else ''}{'fl-' if self.freeze_layers else ''}{'fbn-' if self.freeze_batch_norm else ''}" \
               f"{self.base_model_type.value.name}-d{self.dense_layer_neurons}-do{self.dropout_rate}" \
               f"{'-l1' + np.format_float_scientific(self.l1) if self.l1 > 0 else ''}{'-l2' + np.format_float_scientific(self.l2) if self.l2 > 0 else ''}" \
               f"-{random.randint(1111, 9999)}"
@@ -0,0 +1,24 @@
 import numpy as np
 import pandas as pd
 from sklearn.metrics import accuracy_score, confusion_matrix, log_loss
 def get_metrics(gen, model, save_predictions_file=None):
    model_output = model.predict(gen, verbose=True, workers=12)
    prediction_indices = np.argmax(model_output, axis=1)
    label_index = {v: k for k, v in gen.class_indices.items()}
    predictions = [label_index[p] for p in prediction_indices]
    reals = [label_index[p] for p in gen.classes]
    acc = accuracy_score(reals, predictions)
    ll = log_loss(gen.classes, model_output, labels=[l for l in label_index.keys()])
    conf_mat = confusion_matrix(reals, predictions, labels=[l for l in label_index.values()])
    # print(classification_report(reals, predictions, labels=[l for l in label_index.values()]))
    print("Testing accuracy score is ", acc)
    print("Confusion Matrix", conf_mat)
    if save_predictions_file:
        df = pd.DataFrame(columns=['fname', 'prediction', 'true_val'])
        df['fname'] = [x for x in gen.filenames]
        df['prediction'] = predictions
        df["true_val"] = reals
        df.to_csv(save_predictions_file, index=False)
    return acc, ll
@@ -1,7 +1,7 @@
-from collections import Callable
+from typing import Callable
 class ModelWrapper(object):
-    def __init__(self, model_func:Callable, model_preprocessor:Callable):
+    def __init__(self, model_func:Callable, model_preprocessor:Callable, name:str):
        self.model_func = model_func
        self.model_preprocessor = model_preprocessor
        self.name = name
@@ -0,0 +1,5 @@
 import pandas as pd
 df = pd.read_csv("models/keras/pt-fl-fbn-efficientnet_v2s-d1024-do0.5-l11.e-04-l21.e-04-8105-second_stage.csv")
 print(df.loc[df["prediction"] != df["true_val"]])
@@ -0,0 +1 @@
 tensorboard --logdir_spec=local:./logs,remote:Z:/MachineLearning/Tensorboard/Tensordex/Logs --bind_all
@@ -19,7 +19,6 @@ for index, row in df2.iterrows():
 incorrect = df[df["prediction"]!= df["true_val"]]
 total_same_fam = 0
 # TODO: Add in support for figuring out if the pokemon are related/evolutions of one another
 for index, row in incorrect.iterrows():
    img = mpimg.imread("./SingleImageTestSet/" + row['fname'])
    imgplot = plt.imshow(img)
--- a/Show More
+++ b/Show More
Author	SHA1	Message	Date
Lucas Oskorep	0d20122815	Add new file	2024-03-31 18:12:02 +00:00
Lucas Oskorep	dc427837f6	feat: adding resnet and formatting updates	2023-04-06 00:37:59 -04:00
Lucas Oskorep	ce5939d8a9	Update .gitlab-ci.yml file	2022-07-09 19:07:02 +00:00
Lucas Oskorep	f70690efa8	merging to change repository base	2022-06-07 19:33:40 -04:00
Lucas	01703639ac	adding todo	2022-06-03 15:59:18 -04:00
Lucas	6add80bd27	Removing unused import	2022-06-03 13:55:06 -04:00
Lucas	d111cdae69	Updates to all parts of model building - moving to frozen transfer learning followed by slowed learning rate fine tuning using EfficientNets for final model.	2022-06-03 13:44:34 -04:00
Lucas	755fcde3a9	clean up imports. fix naming, force CPU to fill the cache faster with images using 20 workers.	2022-06-01 18:52:55 -04:00
Lucas	1b539d6945	renaming all files - moving training to be a single file for transfer vs not transfer learning. Made the testing file test all models. Needs to be updated to only update with new models.	2022-06-01 17:46:55 -04:00
Lucas	ab0b7a0a4a	Merge remote-tracking branch 'origin/master' # Conflicts: # 1 - ImageGatherer.py # 3 - TestTrainSplit.py # 4 - TransferLearningKeras.py	2022-05-25 19:59:11 -04:00
Lucas Oskorep	1dc7c2dee2	Updates....updates everywhere	2019-07-17 12:30:16 -05:00
`@@ -1 +1,2 @@`
	`from .image_class_builder import ImageClassModelBuilder, ImageClassModels`	`from .image_class_builder import ImageClassModelBuilder, ImageClassModels`
		`from .model_testing import get_metrics`
		`@@ -0,0 +1 @@`
							`tensorboard --logdir_spec=local:./logs,remote:Z:/MachineLearning/Tensorboard/Tensordex/Logs --bind_all`