3 năm trước cách đây · 5e4ed96dcc
--- a/code/csv2grid_bis.py
+++ b/code/csv2grid_bis.py
@@ -25,17 +25,14 @@ for a in range(0, len(df), slices_length):
 
				     #finds the segment offset of the 100th transcription entry and stores it into var 
			
 
				     #in milliseconds
			
 
				     audio_offset = df_sliced['segment_offset'].max()
			
 
				-
			
 
				-    #finds the segment offset of the 100th transcription entry and stores it into var 
			
 
				-    #in milliseconds
			
 
				-    audio_offset = int(df_sliced.tail(1)['segment_offset'])
			
 
				-
			
 
				+    
			
 
				     #extracts recording at desired length and exports it to new file
			
 
				     recording_sliced = recording[audio_onset:audio_offset]
			
 
				-    recording_sliced.export("outputs/csv2grid_output/BN{0}.wav".format(a), format='wav')
			
 
				+    recording_sliced.export("outputs/csv2grid_output/BN-{0}-{1}.wav".format(audio_onset, audio_offset), format='wav')
			
 
				     
			
 
				     #create textgrid
			
 
				     grid = pr.TextGrid(xmax = (audio_offset-audio_onset)/1000)
			
 
				+
			
 
				     #iterate through each row
			
 
				     for speaker, segments in df_sliced.groupby('speaker_id'):
			
 
				         aTier = grid.add_tier(speaker)
			
@@ -52,7 +49,7 @@ for a in range(0, len(df), slices_length):
 
				                 False
			
 
				               )
			
 
				 
			
 
				-        grid.to_file("outputs/csv2grid_output/BN{0}.TextGrid".format(a))
			
 
				+        grid.to_file("outputs/csv2grid_output/BN-{0}-{1}.TextGrid".format(audio_onset, audio_offset))
			
 
				     
			
 
				     
			
 
				     #the end cut for this iteration becomes the starting point for next iteration
			
--- a/outputs/csv2grid_output/BN-0-727249.TextGrid
+++ b/outputs/csv2grid_output/BN-0-727249.TextGrid
--- a/outputs/csv2grid_output/BN-0-727249.wav
+++ b/outputs/csv2grid_output/BN-0-727249.wav
--- a/outputs/csv2grid_output/BN-11713679-12888038.TextGrid
+++ b/outputs/csv2grid_output/BN-11713679-12888038.TextGrid
--- a/outputs/csv2grid_output/BN-11713679-12888038.wav
+++ b/outputs/csv2grid_output/BN-11713679-12888038.wav
--- a/outputs/csv2grid_output/BN-12888038-13238719.TextGrid
+++ b/outputs/csv2grid_output/BN-12888038-13238719.TextGrid
--- a/outputs/csv2grid_output/BN-12888038-13238719.wav
+++ b/outputs/csv2grid_output/BN-12888038-13238719.wav
--- a/outputs/csv2grid_output/BN-1297003-1913555.TextGrid
+++ b/outputs/csv2grid_output/BN-1297003-1913555.TextGrid
--- a/outputs/csv2grid_output/BN-1297003-1913555.wav
+++ b/outputs/csv2grid_output/BN-1297003-1913555.wav
--- a/outputs/csv2grid_output/BN-13238719-13613565.TextGrid
+++ b/outputs/csv2grid_output/BN-13238719-13613565.TextGrid
--- a/outputs/csv2grid_output/BN-13238719-13613565.wav
+++ b/outputs/csv2grid_output/BN-13238719-13613565.wav
--- a/outputs/csv2grid_output/BN-13613565-14255074.TextGrid
+++ b/outputs/csv2grid_output/BN-13613565-14255074.TextGrid
--- a/outputs/csv2grid_output/BN-13613565-14255074.wav
+++ b/outputs/csv2grid_output/BN-13613565-14255074.wav
--- a/outputs/csv2grid_output/BN-14255074-14833981.TextGrid
+++ b/outputs/csv2grid_output/BN-14255074-14833981.TextGrid
--- a/outputs/csv2grid_output/BN-14255074-14833981.wav
+++ b/outputs/csv2grid_output/BN-14255074-14833981.wav
--- a/outputs/csv2grid_output/BN-14833981-16306674.TextGrid
+++ b/outputs/csv2grid_output/BN-14833981-16306674.TextGrid
--- a/outputs/csv2grid_output/BN-14833981-16306674.wav
+++ b/outputs/csv2grid_output/BN-14833981-16306674.wav
--- a/outputs/csv2grid_output/BN-16306674-17054259.TextGrid
+++ b/outputs/csv2grid_output/BN-16306674-17054259.TextGrid
--- a/outputs/csv2grid_output/BN-16306674-17054259.wav
+++ b/outputs/csv2grid_output/BN-16306674-17054259.wav
--- a/outputs/csv2grid_output/BN-17054259-23247460.TextGrid
+++ b/outputs/csv2grid_output/BN-17054259-23247460.TextGrid
--- a/outputs/csv2grid_output/BN-17054259-23247460.wav
+++ b/outputs/csv2grid_output/BN-17054259-23247460.wav
--- a/outputs/csv2grid_output/BN-1913555-2452477.TextGrid
+++ b/outputs/csv2grid_output/BN-1913555-2452477.TextGrid
--- a/outputs/csv2grid_output/BN-1913555-2452477.wav
+++ b/outputs/csv2grid_output/BN-1913555-2452477.wav
--- a/outputs/csv2grid_output/BN-23247460-24031021.TextGrid
+++ b/outputs/csv2grid_output/BN-23247460-24031021.TextGrid
--- a/outputs/csv2grid_output/BN-23247460-24031021.wav
+++ b/outputs/csv2grid_output/BN-23247460-24031021.wav
--- a/outputs/csv2grid_output/BN-24031021-24466783.TextGrid
+++ b/outputs/csv2grid_output/BN-24031021-24466783.TextGrid
--- a/outputs/csv2grid_output/BN-24031021-24466783.wav
+++ b/outputs/csv2grid_output/BN-24031021-24466783.wav
--- a/outputs/csv2grid_output/BN-24466783-25326278.TextGrid
+++ b/outputs/csv2grid_output/BN-24466783-25326278.TextGrid
--- a/outputs/csv2grid_output/BN-24466783-25326278.wav
+++ b/outputs/csv2grid_output/BN-24466783-25326278.wav
--- a/outputs/csv2grid_output/BN-2452477-2899258.TextGrid
+++ b/outputs/csv2grid_output/BN-2452477-2899258.TextGrid
--- a/outputs/csv2grid_output/BN-2452477-2899258.wav
+++ b/outputs/csv2grid_output/BN-2452477-2899258.wav
--- a/outputs/csv2grid_output/BN-25326278-26083541.TextGrid
+++ b/outputs/csv2grid_output/BN-25326278-26083541.TextGrid
--- a/outputs/csv2grid_output/BN-25326278-26083541.wav
+++ b/outputs/csv2grid_output/BN-25326278-26083541.wav
--- a/outputs/csv2grid_output/BN-26083541-26611587.TextGrid
+++ b/outputs/csv2grid_output/BN-26083541-26611587.TextGrid
--- a/outputs/csv2grid_output/BN-26083541-26611587.wav
+++ b/outputs/csv2grid_output/BN-26083541-26611587.wav
--- a/outputs/csv2grid_output/BN-26611587-27396628.TextGrid
+++ b/outputs/csv2grid_output/BN-26611587-27396628.TextGrid
--- a/outputs/csv2grid_output/BN-26611587-27396628.wav
+++ b/outputs/csv2grid_output/BN-26611587-27396628.wav
--- a/outputs/csv2grid_output/BN-27396628-32343502.TextGrid
+++ b/outputs/csv2grid_output/BN-27396628-32343502.TextGrid
--- a/outputs/csv2grid_output/BN-27396628-32343502.wav
+++ b/outputs/csv2grid_output/BN-27396628-32343502.wav
--- a/outputs/csv2grid_output/BN-2899258-3276322.TextGrid
+++ b/outputs/csv2grid_output/BN-2899258-3276322.TextGrid
--- a/outputs/csv2grid_output/BN-2899258-3276322.wav
+++ b/outputs/csv2grid_output/BN-2899258-3276322.wav
--- a/outputs/csv2grid_output/BN-32343502-32848532.TextGrid
+++ b/outputs/csv2grid_output/BN-32343502-32848532.TextGrid
--- a/outputs/csv2grid_output/BN-32343502-32848532.wav
+++ b/outputs/csv2grid_output/BN-32343502-32848532.wav
--- a/outputs/csv2grid_output/BN-3276322-3733863.TextGrid
+++ b/outputs/csv2grid_output/BN-3276322-3733863.TextGrid
--- a/outputs/csv2grid_output/BN-3276322-3733863.wav
+++ b/outputs/csv2grid_output/BN-3276322-3733863.wav
--- a/outputs/csv2grid_output/BN-32848532-33866980.TextGrid
+++ b/outputs/csv2grid_output/BN-32848532-33866980.TextGrid
--- a/outputs/csv2grid_output/BN-32848532-33866980.wav
+++ b/outputs/csv2grid_output/BN-32848532-33866980.wav
--- a/outputs/csv2grid_output/BN-33866980-34478861.TextGrid
+++ b/outputs/csv2grid_output/BN-33866980-34478861.TextGrid
--- a/outputs/csv2grid_output/BN-33866980-34478861.wav
+++ b/outputs/csv2grid_output/BN-33866980-34478861.wav
--- a/outputs/csv2grid_output/BN-34478861-35221186.TextGrid
+++ b/outputs/csv2grid_output/BN-34478861-35221186.TextGrid
--- a/outputs/csv2grid_output/BN-34478861-35221186.wav
+++ b/outputs/csv2grid_output/BN-34478861-35221186.wav
--- a/outputs/csv2grid_output/BN-35221186-35542709.TextGrid
+++ b/outputs/csv2grid_output/BN-35221186-35542709.TextGrid
--- a/outputs/csv2grid_output/BN-35221186-35542709.wav
+++ b/outputs/csv2grid_output/BN-35221186-35542709.wav
--- a/outputs/csv2grid_output/BN-35542709-35807715.TextGrid
+++ b/outputs/csv2grid_output/BN-35542709-35807715.TextGrid
--- a/outputs/csv2grid_output/BN-35542709-35807715.wav
+++ b/outputs/csv2grid_output/BN-35542709-35807715.wav
--- a/outputs/csv2grid_output/BN-35807715-36145243.TextGrid
+++ b/outputs/csv2grid_output/BN-35807715-36145243.TextGrid
--- a/outputs/csv2grid_output/BN-35807715-36145243.wav
+++ b/outputs/csv2grid_output/BN-35807715-36145243.wav
--- a/outputs/csv2grid_output/BN-36145243-36727997.TextGrid
+++ b/outputs/csv2grid_output/BN-36145243-36727997.TextGrid
--- a/outputs/csv2grid_output/BN-36145243-36727997.wav
+++ b/outputs/csv2grid_output/BN-36145243-36727997.wav
--- a/outputs/csv2grid_output/BN-36727997-37247175.TextGrid
+++ b/outputs/csv2grid_output/BN-36727997-37247175.TextGrid
--- a/outputs/csv2grid_output/BN-36727997-37247175.wav
+++ b/outputs/csv2grid_output/BN-36727997-37247175.wav
--- a/outputs/csv2grid_output/BN-37247175-37616206.TextGrid
+++ b/outputs/csv2grid_output/BN-37247175-37616206.TextGrid
--- a/outputs/csv2grid_output/BN-37247175-37616206.wav
+++ b/outputs/csv2grid_output/BN-37247175-37616206.wav
--- a/outputs/csv2grid_output/BN-3733863-4027879.TextGrid
+++ b/outputs/csv2grid_output/BN-3733863-4027879.TextGrid
--- a/outputs/csv2grid_output/BN-3733863-4027879.wav
+++ b/outputs/csv2grid_output/BN-3733863-4027879.wav
--- a/outputs/csv2grid_output/BN-37616206-37888278.TextGrid
+++ b/outputs/csv2grid_output/BN-37616206-37888278.TextGrid
--- a/outputs/csv2grid_output/BN-37616206-37888278.wav
+++ b/outputs/csv2grid_output/BN-37616206-37888278.wav
--- a/outputs/csv2grid_output/BN-37888278-38164532.TextGrid
+++ b/outputs/csv2grid_output/BN-37888278-38164532.TextGrid
--- a/outputs/csv2grid_output/BN-37888278-38164532.wav
+++ b/outputs/csv2grid_output/BN-37888278-38164532.wav
--- a/outputs/csv2grid_output/BN-38164532-38459010.TextGrid
+++ b/outputs/csv2grid_output/BN-38164532-38459010.TextGrid
--- a/outputs/csv2grid_output/BN-38164532-38459010.wav
+++ b/outputs/csv2grid_output/BN-38164532-38459010.wav
--- a/outputs/csv2grid_output/BN-38459010-38748354.TextGrid
+++ b/outputs/csv2grid_output/BN-38459010-38748354.TextGrid
--- a/outputs/csv2grid_output/BN-38459010-38748354.wav
+++ b/outputs/csv2grid_output/BN-38459010-38748354.wav
--- a/outputs/csv2grid_output/BN-38748354-39175984.TextGrid
+++ b/outputs/csv2grid_output/BN-38748354-39175984.TextGrid
--- a/outputs/csv2grid_output/BN-38748354-39175984.wav
+++ b/outputs/csv2grid_output/BN-38748354-39175984.wav
--- a/outputs/csv2grid_output/BN-39175984-39575381.TextGrid
+++ b/outputs/csv2grid_output/BN-39175984-39575381.TextGrid
--- a/outputs/csv2grid_output/BN-39175984-39575381.wav
+++ b/outputs/csv2grid_output/BN-39175984-39575381.wav
--- a/outputs/csv2grid_output/BN-39575381-39927044.TextGrid
+++ b/outputs/csv2grid_output/BN-39575381-39927044.TextGrid
--- a/outputs/csv2grid_output/BN-39575381-39927044.wav
+++ b/outputs/csv2grid_output/BN-39575381-39927044.wav
--- a/outputs/csv2grid_output/BN-39927044-40458515.TextGrid
+++ b/outputs/csv2grid_output/BN-39927044-40458515.TextGrid
--- a/outputs/csv2grid_output/BN-39927044-40458515.wav
+++ b/outputs/csv2grid_output/BN-39927044-40458515.wav
--- a/outputs/csv2grid_output/BN-4027879-4270829.TextGrid
+++ b/outputs/csv2grid_output/BN-4027879-4270829.TextGrid
--- a/outputs/csv2grid_output/BN-4027879-4270829.wav
+++ b/outputs/csv2grid_output/BN-4027879-4270829.wav
--- a/outputs/csv2grid_output/BN-40458515-41678931.TextGrid
+++ b/outputs/csv2grid_output/BN-40458515-41678931.TextGrid
--- a/outputs/csv2grid_output/BN-40458515-41678931.wav
+++ b/outputs/csv2grid_output/BN-40458515-41678931.wav
--- a/outputs/csv2grid_output/BN-41678931-42381880.TextGrid
+++ b/outputs/csv2grid_output/BN-41678931-42381880.TextGrid
--- a/outputs/csv2grid_output/BN-41678931-42381880.wav
+++ b/outputs/csv2grid_output/BN-41678931-42381880.wav
--- a/outputs/csv2grid_output/BN-42381880-42793928.TextGrid
+++ b/outputs/csv2grid_output/BN-42381880-42793928.TextGrid
--- a/outputs/csv2grid_output/BN-42381880-42793928.wav
+++ b/outputs/csv2grid_output/BN-42381880-42793928.wav
--- a/outputs/csv2grid_output/BN-4270829-4546045.TextGrid
+++ b/outputs/csv2grid_output/BN-4270829-4546045.TextGrid
--- a/outputs/csv2grid_output/BN-4270829-4546045.wav
+++ b/outputs/csv2grid_output/BN-4270829-4546045.wav
--- a/outputs/csv2grid_output/BN-42793928-42993202.TextGrid
+++ b/outputs/csv2grid_output/BN-42793928-42993202.TextGrid
--- a/outputs/csv2grid_output/BN-42793928-42993202.wav
+++ b/outputs/csv2grid_output/BN-42793928-42993202.wav
--- a/outputs/csv2grid_output/BN-42993202-43262842.TextGrid
+++ b/outputs/csv2grid_output/BN-42993202-43262842.TextGrid
--- a/outputs/csv2grid_output/BN-42993202-43262842.wav
+++ b/outputs/csv2grid_output/BN-42993202-43262842.wav
--- a/outputs/csv2grid_output/BN-43262842-43560538.TextGrid
+++ b/outputs/csv2grid_output/BN-43262842-43560538.TextGrid
--- a/outputs/csv2grid_output/BN-43262842-43560538.wav
+++ b/outputs/csv2grid_output/BN-43262842-43560538.wav
--- a/outputs/csv2grid_output/BN-43560538-43945132.TextGrid
+++ b/outputs/csv2grid_output/BN-43560538-43945132.TextGrid
--- a/outputs/csv2grid_output/BN-43560538-43945132.wav
+++ b/outputs/csv2grid_output/BN-43560538-43945132.wav
--- a/outputs/csv2grid_output/BN5300.TextGrid
+++ b/outputs/csv2grid_output/BN5300.TextGrid