doi
/
2023_Kalantari_AIDAqc
برگرفته از Aswendt_Lab/2023_Kalantari_AIDAqc


			
							123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160161162163164165166167168169170171172173174175176177178179180181182183184185186187188189190191192193194195196197198199200201202203204205206207208209210211212
							# -*- coding: utf-8 -*-
"""
Created on Fri Sep  1 17:57:59 2023

@author: arefks
"""

import glob
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from scipy.stats import ttest_ind, f_oneway
import glob
import os
from scipy.stats import ttest_ind
from statsmodels.stats.multitest import multipletests
import re
from statsmodels.stats.inter_rater import fleiss_kappa
from statsmodels.stats.inter_rater import aggregate_raters

#%function

def calculate_and_display_fleiss_kappa(data):
    kappa, _ = fleiss_kappa(data)
    print("Fleiss' Kappa:", kappa)
    return kappa

#%% Expert

Path_votings = r"Z:\2023_Kalantari_AIDAqc\outputs\QC_Final\validation\*\votings.csv"

All_csv_votings = glob.glob(Path_votings)

def read_csv_files(files):
    data_dict = {}
    for ff,file in enumerate(files):
        df = pd.read_csv(file)    
        #data_dict[ff] = df[df["Voting outliers (from 5)"]] 
        data_dict[ff] = df
            
    return data_dict

All_values = read_csv_files(All_csv_votings)

img_values = []

for df_name, df in All_values.items():
    if "corresponding_img" in df.columns:
        img_values.extend(df["corresponding_img"].tolist())

new_df = pd.DataFrame({"corresponding_img": img_values})

MU_strings = ["adam","joanes"]

Sequence_type = ["anatomical"]
cc=0
cm = 1/2.54  # centimeters in inches

plt.figure(figsize=(18*cm, 9*cm))
fig, ax = plt.subplots(1,2, dpi=300,figsize=(18*cm, 9*cm))#,sharex="row",sharey="row")
#fig.suptitle('Confusion matrix',fontname='Times New Roman')
        
Matric_sequneces = []
for ss,S in enumerate(Sequence_type):
    for mu,MU in enumerate(MU_strings):
        
        Path = r"Z:\2023_Kalantari_AIDAqc\outputs\QC_Final\validation\*\votings.csv"
        
        p_afs = os.path.join(os.path.dirname(Path),S+"*.png")
        
        afs_all = glob.glob(p_afs,recursive=True)
        afs_all = [os.path.basename(path) for path in afs_all]
        
        
        count_afs_all = len(afs_all)
        

        Path_gt = r"Z:\2023_Kalantari_AIDAqc\outputs\QC_Final\validation\*\validation_" + MU
        
        pgt_afs = os.path.join(Path_gt, S+"*.png")
        
        afsgt_all = glob.glob(pgt_afs,recursive=True)
        
        afsgt_all = [os.path.basename(path) for path in afsgt_all]
        
        countgt_afs_bad = len(afsgt_all)
        
        countgt_afs_good = count_afs_all - countgt_afs_bad
        
        
        # Separate the new_df DataFrame based on specific prefixes
        afsqc_all = new_df[new_df['corresponding_img'].str.startswith(S)]['corresponding_img'].tolist()
        
        countqc_afs_bad = len(afsqc_all)
        countqc_afs_good = count_afs_all - countqc_afs_bad
        
        
        afs_intersect_qc_gt = set(afsgt_all) & set(afsqc_all)
# =============================================================================
#         afs_TN = len(afs_intersect_qc_gt)
#         afs_FN = countqc_afs_bad - afs_TN
#         afs_FP = countgt_afs_bad - afs_TN
#         afs_TP = countgt_afs_good - afs_FN
# =============================================================================
        afs_TP = len(afs_intersect_qc_gt)
        afs_FN = countgt_afs_bad - afs_TP
        afs_FP = countqc_afs_bad - afs_TP
        afs_TN = countgt_afs_good - afs_FP
        
# =============================================================================
        afs_percent_TP = (afs_TP / countgt_afs_bad)
        afs_percent_FN = (1 - afs_percent_TP)
        afs_percent_FP = (afs_FP /countgt_afs_good)
        afs_percent_TN = (1 - afs_percent_FP)
# =============================================================================
        
        
        # Calculate precision
        precision = afs_TP / (afs_TP + afs_FP)
        #print("precision"+str(precision))
        # Calculate recall
        recall = afs_TP / (afs_TP + afs_FN)
        #print("recall:"+str(recall))
        
        # Calculate F1 score
        f1_score = 2 * (precision * recall) / (precision + recall)
        
        # Print the F1 score
        #print("F1 Score:", f1_score)

        
        confusion_matrix = [[afs_percent_TP, afs_percent_FN],
                             [afs_percent_FP, afs_percent_TN]]
# =============================================================================
#         Per = afs_TP + afs_FN+afs_FP +afs_TN
#         confusion_matrix = [[afs_TP/Per, afs_FN/Per],
#                     [afs_FP/Per, afs_TN/Per]]
# 
# =============================================================================
        
        
        # Create a heatmap using Seaborn
        sns.set(font_scale=0.8)  # Adjust the font size
        heatmap = sns.heatmap(confusion_matrix, annot=True, fmt='.2%', cmap='Greys',
                              annot_kws={"fontname": "Times New Roman"},
                              xticklabels=False, yticklabels=False, cbar=False,ax=ax[mu,ss])
        ax[mu, ss].set_xlabel('AIDAqc', fontname='Times New Roman')
        ax[mu, ss].set_ylabel("Test", fontname='Times New Roman')
        ax[mu, ss].set_title(S.capitalize()+'\n F1-score: %.2f' % f1_score + "", fontname='Times New Roman', weight="bold")
        ax[mu, ss].set_xticks([0.5, 1.5])
        ax[mu, ss].set_xticklabels(['bad', 'good'], fontname='Times New Roman')
        ax[mu, ss].set_yticks([0.5, 1.5])
        ax[mu, ss].set_yticklabels(['bad', 'good'], fontname='Times New Roman',rotation=90)
        
        
        Vec = [0 if item in afsgt_all else 1 for item in afs_all]
        Matric_sequneces.append(Vec)
        

    Vec_qc = [0 if item in afsqc_all else 1 for item in afs_all]   
    Matric_sequneces.append(Vec_qc)   
        
        
# Show the plot
#plt.subplots_adjust(left=0.00, right=1, top=1, bottom=0.00, wspace=0.3, hspace=1.8)
plt.tight_layout()
plt.show()


Stacked_anat = np.stack(Matric_sequneces[0:4],axis=0).transpose()
Stacked_func = np.stack(Matric_sequneces[4:8],axis=0).transpose()
Stacked_struct = np.stack(Matric_sequneces[8:12],axis=0).transpose()

Stacked_anat_bool = Stacked_anat.astype(bool)
Stacked_func_bool = Stacked_func.astype(bool)
Stacked_struct_bool = Stacked_struct.astype(bool)

# Define column labels
column_labels = ["experienced", "expert", "aidaqc"]

# Create pandas DataFrames
df_anat = pd.DataFrame(Stacked_anat_bool, columns=column_labels)
df_func = pd.DataFrame(Stacked_func_bool, columns=column_labels)
df_struct = pd.DataFrame(Stacked_struct_bool, columns=column_labels)

from sklearn.metrics import cohen_kappa_score

# Create a list of DataFrames
dataframes = [df_anat, df_func, df_struct]

# Loop through the DataFrames
for i, df in enumerate(dataframes):
    print(f"DataFrame {i + 1}:")
    for col1 in df.columns:
        for col2 in df.columns:
            if col1 != col2:
                kappa_score = cohen_kappa_score(df[col1], df[col2])
                print(f"Cohen's Kappa Score between {col1} and {col2}: {kappa_score:.4f}")
    print()