[Whisper] Robust Speech Recognition via Large-Scale Weak Supervision - (1)
·
👾 Deep Learning
[leetcode-2] Add Two Numbers
·
🐢 One step
LeetCode-2 Add Two Numbers : Add Two Numbers in Linked List note : You may assume the two numbers do not contain any leading zero, except the number 0 itself.myAnswer :::python #Definition for singly-linked list. class ListNode: def init(self, val=0, next=None): self.val = val self.next = next class Solution: def addTwoNumbers(self, l1: Optional[ListNode], l2: Optional[ListNode]) -> Optional[Lis..
[leetcode-206] Reverse Linked List
·
🐢 One step
LeetCode-206 Reverse Linked List : Reverse Linked List note : 연결 리스트 역순으로 정렬 :::python # Definition for singly-linked list. # class ListNode: # def init(self, val=0, next=None): # self.val = val # self.next = next class Solution: def reverseList(self, head: Optional[ListNode]) -> Optional[ListNode]: def reverse(node: ListNode, prev: ListNode = None): if not node: return prev next, node.next = no..
[Whisper] Kspon Valid --- (2) CER
·
👾 Deep Learning
Robust Speech Recognition via Large-Scale Weak Supervision *large model은 2023.1 large-v2와 동일하게 바뀜 KsponSpeech 데이터는 짧은 발화의 audio를 주로 구성되어있다. Whisper는 99개의 토큰으로 처음 발화에 대한 언어 예측(language identification)을 수행한다. 하지만 너무 짧은 발화 같은 경우 whisper가 다른 언어로 예측해 translate 자체가 틀려버려 CER이 증가하는 것을 볼 수 있다. language Configure을 korean으로 설정하면 language identification을 수행하지 않고 바로 transcript로 예측해 더 좋은 성과가 났다. model size는 예..
[leetcode-21] Merge Two Sorted Lists
·
🐢 One step
LeetCode-21 Merge Two Sorted Lists : Merge Two lists note : recursive :::python # Definition for singly-linked list. # class ListNode: # def init(self, val=0, next=None): # self.val = val # self.next = next class Solution: def mergeTwoLists(self, list1: Optional[ListNode], list2: Optional[ListNode]) -> Optional[ListNode]: if (not list1) or (list2 and list1.val > list2.val): list1, list2 = list2,..
[leetcode 234] Palindrom Linked List
·
🐢 One step
LeetCode-234 Palindrome Linked List : 주어진 head가 palindrome인지 아닌지 note : range : 1~10^5MyAnswer :::python # Definition for singly-linked list. # class ListNode: # def init(self, val=0, next=None): # self.val = val # self.next = next class Solution: def isPalindrome(self, head: Optional[ListNode]) -> bool: temp: List = [] if not head: return True node = head while node is not None: temp.append(nod..
[Whisper] Koreanspon Valid
·
👾 Deep Learning
https://aihub.or.kr/aihubdata/data/view.do?currMenu=115&topMenu=100&dataSetSn=123 AI-Hub 분야한국어 유형 오디오 , 텍스트 갱신년월 : 2023-02 구축년도 : 2018 조회수 : 6,273 다운로드 : 12,094 용량 : 다운로드 관심데이터 등록 관심 31 aihub.or.kr Whisper 한국어 음성 (Ksponspeech dataset) 검증 Kspon의 eval_clean데이터를 사용해 Whisper의 성능 지표를 작성해보았다. 사용 모델 (large 모델, 추후 다양한 실험 진행) 첫 실험은 large 모델을 사용해 language identification을 한국어로 설정하지 않고 CER을 계산했다. 결과 0.42로 놀..
[kaggle MLOlympiad Competition] 오랜만에 ML
·
🏃 Routine
Google MLOlypiad 2023 오랜만에 Deep Learning에서 벗어나 데분에 기초 내용을 다지고자 MLOlypiad에 참여했다. 대회 기간이 짧았던 터라 인기가 많이 없었다. 하지만 소수라 해볼만한지 엄청 치열했었다. Argania Classification 아르가니아는 모로코에 서식하는 나무의 한 종이다. 이 나무의 feature를 통해 분류하는 문제이다. 대회 처음에는 무난하게 svm classification을 사용해 90% 정확도로 1위에 올랐었다. 그러나 대회 1주일을 남기고 Oliver라는 사람이 등장해 91%로 순위를 쟁탈했다. 이후 Gridsearch로 parameter 최적화하고 random_stat를 조정해 다시 1위를 가져왔다. 이후 다시 Oliver가 94%로 쫓아와서..
다했다