'분류 전체보기' 카테고리의 글 목록 (8 Page)

string method. 1~20

2024.04.28·

🐍 Python

Python String Methods1) capitalize() : 문자열의 첫 글자를 대문자로 변환text: str = "hello"print(text.capitalize()) # Hello2) casefold() : 문자열을 소문자로 변환text1: str = 'MARIo'text2: str = 'maRIO'print(text1.casefold()) # marioprint(text2.casefold()) # marioprint(text1.casefold() == text2.casefold()) # True3) center() : 문자열을 가운데 정렬text: str = "hello"print(text.center(20)) # hello print(text.center(20,..

[2024-1] 운의 방정식 (스즈키 유)

2024.04.25·

📚 Book

제목: "운의 방정식"저자: 스즈키 유 keyword빌게이츠 레이크 사이드 고등학교 1968 컴퓨터중국 입학시기 9월 (3 r월 ceo 23% 6 7 12%)행운 = (행동 * 다양 + 인지) * 회복헨리 모즐리 원자 번호 제프리 다이어 팀 연구파인만 배뇨 물구나무서기윈스콘신 대학 천재 퍼스널리티The bias of against creativity니콜라 로메오 퍼시 스펜서Inatentional blindness존 펨버턴 약제사 / 에이서 캔들러 코카 콜라Hot streak = jackpot Microdoes 지속적인 결과물을 위한 인내력 테스트요메이슈 400침습 경계빌보드 탑 앨범 발매 이후 성적 평균 40~45다니엘 커너먼 성공의 원인을 단순한 곳에서 찾는모순 관련 자료 1) Inatentional..

[rsyslog] 다시 만난 rsyslogd: action 'action-2-builtin:omfile' resumed (module 'builtin:omfile')

2024.04.17·

🧑‍💻 Develop

https://bnmy6581.tistory.com/311 [rsyslog] imklog: cannot open kernel log, ERROR (Syntax error, this crontab file will be ignored), Operation not permitted. syslog 보다 더 많은 기능을 제공하는 rsyslog 로그 관리 프로그램을 docker로 빌드해 root 환경에서 사용할 때 겪는 에러를 알아보자. 1) rsyslogd: imklog: cannot open kernel log (/proc/kmsg): Operation not permitted. imkl bnmy6581.tistory.com 위에 정리한 ERROR의 해결 방법을 적었음에도 다른 ERROR로 오인해 한참을 찾았..

[Challenge] 생성형 AI 레드팀 챌린지

2024.04.13·

🏃 Routine

AI 레드팀이란? AI Application에서 공격 시나리오를 시뮬레이션하고 약점을 찾아내어 예방하기 위한 조직입니다. 이 프로세스는 가능한 다양한 침투 전술과 기능 문제로부터 AI 모델을 보호하는데 도움이 됩니다. 또한 AI 레드팀을 통해 AI 시스템 취약점을 발견하여, 안정성을 강화하고, AI가 안전하고 윤리적으로 활용되도록 하는 것이 목표입니다. 기존의 레드팀과 AI 레드팀은 애플리케이션의 보안 개선이 서로 같은 목표이지만 AI 레드팀은 애플리케이션의 접근 방식에 차이가 있어 "블랙박스"로 작동하며 이 차이로 시간에 따라 모델이 변화하고 learning data가 공개되어 있지 않아 문제 해결에 어려움이 있습니다. 추가로 환각(hallucination), 부정확하고 유해한 정보 제공 등 LLM의 ..

[CMSA] Yann Lecun | Objective-Driven AI (2)

2024.04.10·

🏃 Routine

Auto-Regressive Large Language Models (AR-LLMs) 하나의 텍스트 토큰 다음에 다른 토큰을 출력 토큰은 단어나 하위단어를 나타냄 인코더/예측기는 수십억 개의 매개변수를 가진 트랜스포머 아키텍처 일반적으로 10억 ~ 5,000억 개의 매개변수 훈련 데이터: 1조 ~ 2조 개의 토큰 사용 대화/텍스트 생성 LLM 종류 Open Source : BlenderBot, Galactica, LlaMa, Llama-2, Code Llama (FAIR), Mistral-7B, Mixtral-4x7 B (Mistral), Falcon (UAE), Alpaca (Stanford), Yi (01.AI), OLMo (AI2), Gemma (Google) Proprietary : Meta A..

[CMSA] Yann Lecun | Objective-Driven AI (1)

2024.04.06·

🏃 Routine

Yann Lecun | Objective-Driven AI: Towards AI systems that can learn, remember, reason, and plan Yann Lecun, 프랑스계 미국 CS 석박으로 Deep Learning의 아버지 3명 중 한 명이다. CMSA는 하버드에서 수학, 과학을 주제로 다루는 연구 센터이다. 여기서 Yann은 AI가 나아가야 할 방향에 대해 설명하며 자신이 생각하는 AGI의 필수 요소를 learn, remember, reason, plan으로 소개했다. 배우고 기억하고 이해하고 설계(목표를 위해 실행) 본 글은 강의의 도입부를 정리함. Machine Learning sucks! 머신러닝은 생각보다 구리다. 동물과 인간 아주 적은 task(행동)으로 새로운..

Embedding Model API 한국어 Token & 비용 비교

2024.03.28·

🗣️ Natural Language Processing

“대한민국 법률 전문”을 가지고 OpenAI(ChatGPT), GOOGLE(Gemini), Antropic(Claude), Upstage(Solar)를 대상으로 embedding 후 token 수를 비교하는 실험을 진행 Goal : API로 제공되는 LLM 중 어떤 모델이 한국어 token을 가장 적게 사용하고 비용 저렴한지 비교 Input Text(대한민국헌법 전문, text length=373) 유구한 역사와 전통에 빛나는 우리들 대한국민은 기미 삼일운동으로 대한민국을 건립하여 세계에 선포한 위대한 독립정신을 계승하여 이제 민주독립국가를 재건함에 있어서 정의인도와 동포애로써 민족의 단결을 공고히 하며 모든 사회적 폐습을 타파하고 민주주의제제도를 수립하여 정치, 경제, 사회, 문화의 모든 영역에 있어..

[BERT] 왜 BERT는 15%의 비율로 모델링 했을까?

2024.03.24·

🗣️ Natural Language Processing

"Should You Mask 15% in Masked Language Modeling?" https://arxiv.org/abs/2202.08005 Should You Mask 15% in Masked Language Modeling? Masked language models (MLMs) conventionally mask 15% of tokens due to the belief that more masking would leave insufficient context to learn good representations; this masking rate has been widely used, regardless of model sizes or masking strategies. In arxiv.org..

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

분류 전체보기

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역

개인정보

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역