목차

오늘의 TIL 순서는

  1. 시작전 마음가짐
  2. Python 문제풀이
  3. 머신러닝 t-SEN 결과해석
  4. AI모델활용 복습
  5. 크롤링 특강
  6. 회고

입니다.

강의 필기와 코드는 GitHub 링크를 참고해주세요

 

TIL/ML/t-SNE.ipynb at main · Onesword-Jang/TIL

오늘 배운 것은?! Contribute to Onesword-Jang/TIL development by creating an account on GitHub.

github.com

 

 


시작전 마음가짐

오늘은 피로가 많이 축척된듯한 시작입니다. 눈이 크게 안떠지네요ㅎㅎ

 

내일 새로운 LLM&RAG 개긴과제가 있는 만큼 밀렸던 복습을 빠르게 진행할 예정입니다.

 

설정한 목표를 빠르게 달성하고 다른 복습까지 진행되었으면 합니다.

 

그리고 데이터 분석이 중요해 보이는데 관련된 자격증이나 학습자료를 찾아볼 생각입니다.

 

그럼 학습을 시작하겟습니다.


Python문제풀이

1. 문자열 곱하기

  • answer에 바로 'my_string*k'는 출력 값 오류 => ''(따옴표를 빼면 정상작동)
  • answer = print('my_string * k',end = "") 출력 값 오류
  • join함수를 사용해서 성공
def solution(my_string, k):
    answer = ''.join(my_string * k)
    return answer

2. 더 크게 합치기

  • 문자열로 바꾸고 진행 한 뒤 정수로 데이터 타입 바꾸기 까지 혼자 해냄
  • max함수가 생각나지 않아서 찾아보았음
def solution(a, b):
    if 1 <= a <= 10000 and 1 <= b <= 10000:
        ab = int(str(a) + str(b))
        ba = int(str(b) + str(a))
        answer = max(ab, ba)
        return answer
# f-스트링 사용
def solution(a, b):
    return int(max(f"{a}{b}", f"{b}{a}"))

3. 두 수의 연산값 비교하기

  • if, elif, else를 사용했는데 elif문 문법 틀림
  • 완료
def solution(a, b):
    ab = int(str(a) + str(b))
    ab2 = 2 * a * b
    if ab > ab2:
        return ab
    elif ab == ab2:
        return ab
    else:
        return ab2
# 짧게 구하는 식
# max함수는 수가 같을 때 항상 앞의 수를 가져온다.
def solution(a, b):
    return max(int(str(a) + str(b)), 2 * a * b)

머신러닝 t-SEN

이번엔 수학적 개념을 신경 쓰지 않고 오로지 t-SEN이 무엇을 선택하며 진행 되는지 그리고 이 분류방법으로 하는게 무엇인지에 대하여 알아보았습니다.

 

의외로 접근이 쉬웠지만 뭔가 알다가 마는 느낌이 없지않아 있었습니다.

목적

  • 복잡한 데이터의 시각화
  • 데이터의 군집 구조나 유사성을 시각적으로 파악

결과 해석

  • 숫자가 시각화에서 분리된 형태로 잘 모여 있다면, t-SNE가 숫자 간의 패턴 차이를 잘 포착했다는 것을 의미
  • 특정 숫자들끼리 서로 겹쳐 있다면, 해당 숫자 간의 특징이 비슷하여 모델이 쉽게 구분하지 못할 가능성이 있음을 의미

AI모델활용 복습

오늘은 5-2 ~5-5 강의까지 수강하였고 큰 트러블은 만나지 않았습니다.

 

복습을 통해 export를 터미널에 사용해서 API키를 사용하는 방법을 알게 되었습니다.

 

이미지와 음성 생성 Ai 코드를 작성해보았는데 일반적인 코드는 어느정도 어떤 기능이구나 하면서 이해가 갓는데 API키를 입력 시키거나 자신의 목소리 데이터는 어떻게 학습 시키는지 모르겟습니다.

 

다음에 기회가 생긴다면 직접 진행해보는 것이 가장 좋은 학습 방법이라 생각이 들었습니다.


크롤링 강의(동적 크롤링)

오늘 몸이 안좋아서 크롤링 강의는 영상이 올라오면 다시 각 잡고 공부해야겟다는 생각으로 가볍게 수강하였습니다.

 

코드를 수정하고 설명하는 부분은 따라가면서 실행은 시켜보지 않았습니다.

 

이 크롤링을 이용해서 많은 정보를 얻을 수 있을 뿐만 아니라 다양한 형태의 데이터를 가지고 올 수 있어 보여 굉장히 효율적이고 좋은 방법이라 생각이 들었습니다.

 

대학시절 상권분석을 해본적이있지만 단순히 포털 싸이트에서 파일을 다운받아 일일이 읽으며 분류했던 기억이있습니다.

 

파이썬과 크롤링을 합치니 포털싸이트의 정보보다 더욱 최신화된 정보와 원하는 정보만을 다룰 수 있어 왜 이렇게까지 인공지능 및 코딩에 열광하는지 조금이나마 알게 된것같습니다.


회고

오늘 오전 학습을 하던 중 아버지께서 응급실에 진료를 보러가신다고 하여 운전을 못하실 상황을 대비해 외출을 하였습니다.

 

굉장히 오랜만의 외출이기도 하고 오랜만에 운정을 한 탓에 몸이 긴장을 한 것인지 다녀 온 이후로 몸이 굉장한 피로감을 표출 하더군요.

 

다행히도 아버지는 몸에 이상이 없는 상태셨고 저는 어머니가 대신 보호자 역할로 오셔서 1시간만에 복귀하여 다시 학습을 진행했습니다.

 

Python문제풀이를 하며

 

파이썬 문제는 언제나 만나면 머리가 텅 비워지는 것같습니다.

 

하지만 천천히 생각하고 생각나는대로 써내려가다보면 어디가 틀린지 알게 되는데요 아직 문제를 푼다는것에 익숙치않아 그런듯합니다.

 

또한 수준별 학습 강의에서 혼동하기 쉬운 형태들과 현업에서 자주 쓰는 함수들을 알려주어 좋았습니다.

 

머신러닝 결과해석을 하며

 

이전의 머신러닝 결과를 분석하며 느낀 것인데 수학적 개념과 시각화된 자료들을 찾아보며 이해도는 높아졌지만 굉장한 시간이 걸렸다고 생각합니다.

 

그래서 오늘은 단순히 t-SEN의 목적과 과정 결과를 보는 방법 등을 위주로 학습하였고 이는 1시간이 조금 넘게 걸리며 짧은 시간만에 끝을 볼 수 있었습니다.

 

이해력을 높이는 것도 좋지만 저는 현재 커리큘럼을 따라가는 입장이니 빠르게 지나가야할건 분명히 해야할 것입니다.

 

AI모델활용 복습을 진행하며

 

음성 및 이미지를 사용하는 AI모델이 작동하는 것을 보는건 언제 봐도 신기하고 재미있습니다.

 

아직 실행을 시켜보지는 못했지만 진행해보면 많은 아이디어들이 떠올라 한동안 가지고 놀 수 있을 정도로 사용해보지 않을까 싶습니다.

 

크롤링 강의를 들으며

 

와 내가 대학 시절에 했던 분석은 거의 무의미한 행동이였구나라는 생각이 머리를 지배하는 강의였습니다. 그만큼 충격으로 다가왔죠

 

저는 지금 이 커리큘럼 과정을 밟으며 데이터를 분석하는 일에 관심이 많이 가고있습니다.

 

크롤링을 자세하게 배워보고 싶습니다.

목차

오늘의 TIL 순서는

  1. 시작전 마음가짐
  2. Python 문제 풀이
  3. LLM&RAG 5주차 내용 정리
  4. 환경변수 문제 해결
  5. 머신러닝 결과 해석
  6. 웹트롤링 특강
  7. 회고

입니다.

 

TIL/크롤링/크롤링_1.ipynb at main · Onesword-Jang/TIL

오늘 배운 것은?! Contribute to Onesword-Jang/TIL development by creating an account on GitHub.

github.com

 

 

TIL/LLM/LLM_RAG_5.ipynb at main · Onesword-Jang/TIL

오늘 배운 것은?! Contribute to Onesword-Jang/TIL development by creating an account on GitHub.

github.com

 

 

TIL/ML/LDA.ipynb at main · Onesword-Jang/TIL

오늘 배운 것은?! Contribute to Onesword-Jang/TIL development by creating an account on GitHub.

github.com

 

 


시작전 마음가짐

지금까지 진행 상황들을 보았을 때 해야할 과제들이 많아지고있습니다.

 

빨리 끝낼 수 있는 주제들을 먼저 처리하며 마음의 짐을 덜고 싶습니다.

 

오늘은 해결을 못한 내용들을 처리하고싶으니 매우 바쁜 하루가 될 것 같습니다.

 

그럼 학습을 시작하겟습니다.


Python 문제 풀이

1. 문자열 겹쳐쓰기

  • 문제를 보고 슬라이싱이 생각남
  • answer = my_string[:s] + overwrite_string 까지 하고 문자열 뒷부분이 빠짐것을 확인
  • overwrite_string 만 추가해서 문자열 뒷부분 겹침 확인
  • s 값을 더해줘서 해결
def solution(my_string, overwrite_string, s):
    answer = my_string[:s] + overwrite_string + my_string[s +len(overwrite_string):]
    return answer

2. 문자열 섞기

  • 분명히 배웠었는데 기억이 나지 않음
  • join, map 등을 활용해보려했으나 실패
  • 검색을 통해 완료 (이전에 배웠던 부분은 리스트컴프리헨션)
# 조건문을 활용한 섞기
def solution(str1, str2):
    answer = ""
    for i in range(len(str1)):
        answer += str1[i] + str2[i]
    return answer
# 리스트 컴프리헨션
def solution(str1, str2):
    answer = [str1[i] + str2[i] for i in range(len(str1))]
    return ''.join(answer)
# map 함수와 join 사용하기
def solution(str1, str2):
    answer = ''.join(map(lambda i: str1[i] + str2[i], range(len(str1))))
    return answer

3. 문자 리스트를 문자열로 변환하기

  • 조인 함수로 성공
  • 아직 조인 함수를 사용하는데 미숙함이있어 문법에서 에러가 나옴
  • 시도한 함수들 join, 데이터 타입 변환, map
def solution(arr):
    answer = ''.join(arr)
    return answer

LLM 5주차 내용 정리

  • 5주차 5-5 강의 정리를 마쳤습니다.
  • LLM과 여러 패키지를 활용하는 방법을 코드로 보여주고 코드의 요소 하나하나 설명해주는 강의였습니다.
  • 하지만 강의의 분기점이 강의 자료의 숫자로만 되어있어 처음에는 강의자료에있는 코드들이 한개의 코드박스에 들어가서 진행하는 코드라 생각하고 진행하였지만 반복하는 부분이 많아 정리하기 어려웠습니다.
  • 또한 많은 정보를 담고있어 차근차근 보아야하고 많은 복습 및 실습이 필요해 보입니다.
  • 복습을 위해 명확하게 파트 분리를 진행하고 복습을 해야할 것으로 보입니다.

환경변수 문제 해결

1. 우선 질문하러 가기 전 다시한번 더 API키 및 환경변수 문제 확인

  1. 작업 영역 소스파일 열거하는 데는 시간이 오래걸립니다. 대신 하위 폴더를 여는 것이 좋습니다. => 하위폴더 사용방법
  2. 대화형 챗봇의 API키 직접 입력시 사용 가능
  3. DOTENV사용 경우: 잘못된 API키를 사용한다는 openai.AuthenticationError 발생 => 환경 변수를 어떻게 설정하는지 봐야할 듯
  4. api키 노출없이 키 사용방법

2. 해결한 문제

  1. vscode를 시작함과 동시에 열려있던 c드라이브 폴더를 그대로 사용해서 문제가 나온거였다. 해결
  2. API키 지정 코드에서 오타 존재 =>client = OpenAI(api_key="api_key")에서 ""제거 => Dotenv로 API키 사용 가능
  3. 키 노출 우려 => .env를 활용해도 print문으로 api키를 출력이 되는게 문제라 판단 => 로컬 컴퓨터 환경 변수에 API키값 저장 => OpenAI Python 라이브러리 버전 1.0.0 이상에서는 이 API가 더 이상 지원되지 않아서 문제 발생 => 생각해보니 코드상에서만 노출이 안되면 print문을 써도 같은 값이 출력이 안되는 것이라느걸 깨달음 => .env 사용하자

3. 4주차 강의부터 다시 실습 실행

  • 5-1 강의 까지 들었고 매끄럽게 강의 수강을 했습니다.
  • 또한 이때까지 환경변수 설정 오류로 나오던 실행경로 오류는 가상환경의 파일과 작업중인 파일의 위치 문제였습니다. => 작업중인 디렉토리에 새로운 가상환경을 설정

머신러닝 결과 해석(LDA)

  • LDA에 대한 해석을 드디어 완료했습니다. 생각보다 간단했는데 수학적 개념으로 된 설명을 읽다보니 머리가 뜨거워진듯 합니다.

LDA란?

  • 우선 LDA는 차원 축소와 분류를 한번에 진행하는 모델이다.
  • 클래스 내의 분산 최소화, 클래스 간의 분산을 최대화 시킨 축을 찾아 차원축소 한다.

간단한 진행과정과 결과 해석

  1. 데이터와 레이블을 분리한다.
  2. 선형판별 축을 찾는다(클래스 수 -1 개)
  3. 찾은 선형판별 축으로 모델학습(선형변환)한다.
  4. 첫번째 열(첫 번째 선형판별 축)과 두번째 열(두 번째 선형판별 축)을 사용하여 시각화하고 데이터의 분산이 잘이루어졌는지 확인한다.

분석을 하는 이유?

  1. 정확성 향상: 분류 성능이 높아지면 잘못된 예측을 줄일 수 있습니다.
  2. 비지니스 성과 개선: 비즈니스 의사결정을 개선하는 데 기여(추천 시스템 등)
  3. 리소스 효율성 향상: 운영 및 리소스 비용을 절감(콜센터 등의 챗봇, 인건비 절감)
  4. 사용자 경험 향상: 사용자에게 더 나은 경험을 제공(스팸 필터 등)
  5. 일반화 성능 향상: 다양한 데이터셋에도 잘 일반화될 수 있다.

크롤링 특강

  • 크롤링 강의를 들으며 가끔 보게 되던 HTML, URL구조, f12를 누르게 되었을 때 만나게 되는 정보들을 알게 되었습니다.
  • 오늘 특강으로 많은 정보를 학습했으니 이 정보들을 더욱 구조화 시켜 내 것으로 만들어야 겟습니다.
  • 특히 신기했던게 URL의 구조를 보고 URL에서 어떤 파라미터들이 어떤 역할인지 알아보고 그것들을 사용한다는게 매우 신기했습니다.
  • 전체적으로 처음듣는 내용이어서 어려웠지만 늘 궁금하던 내용이라 재미있었습니다.

회고

오늘은 전체적으로 학습 시작 전에 생각한대로 흘러가서 학습의 질이 매우 높았습니다.

 

중간에 크롤링 특강의 존재를 알게 되어 머신러닝 t-SEN의 결과분석은 못했지만 크롤링 특강 자체가 매우 흥미있어 괜찮았습니다.

 

Python 문제풀이를 하며

 

파이썬 문제는 풀렸을 때의 쾌감 이 너무 좋습니다.

 

하지만 한가지 문제로 시간을 많이 사용하게 되면 무형의 압박감이 생겨 GPT의 힘을 빌리고 싶어지지만 꾹 참으며 내가했던 필기 자료나 검색을 통하여 이루어 내고있습니다.

 

환경 변수 문제를 해결하며

 

환경 변수 문제 이 때 까지 왜이렇게 고민을 했나 싶을 정도로 쉽게 해결이 되었습니다.

 

지금까지 가상환경을 설치하며 날린 시간들이 조금 아깝지만 이제 이런 문제들이 해결이 되었으니 마음 놓고 실습을 진행할 수 있습니다.!!

 

작업중인 디렉토리에 가상환경 파일을 만들어야한다...

 

머신러닝 결과 분석을 하며

 

LDA이녀석도 저번주에 생각했던 것보다 매우 간단한 녀석이였습니다.

 

전문적인 블로그 글과 유튜브 영상을 참고해서 분석했는데 너무 많은 수학적 용어들이 머리를 복잡하게 만들었던 것 같습니다.

 

추가적으로 분류하는 머신러닝을 공부하고있기에 분류, 분석은 왜 하는 것인지 찾아보았고 그 결과로 왜 이렇게까지 데이터 분석 스킬이 필요한지 이해가 되는 학습이였습니다.

 

크롤링 특강

 

평소 궁금해했던지라 신기하고 재미있었습니다.

 

하지만 어려웠다는... 그리고 마지막에 과제를 주셨는데 날잡고 강의 복습을 진행한 뒤 과제까지 처리해보려 합니다.

 

감사합니다.

 

1. 어떤것들을 공부했는지

이번주는 AI모델활용, 머신러닝, Python, LLM&RAG 강의를 듣고 GITHUB를 활용한 포트폴리오 작성 및 복습하는 시간이였습니다.

원래의 목표로는 머신러닝 결과를 해석을 가장 중요시했지만 중간에 LLM&RAG 강의를 새롭게 듣게 되어 강의 완강을 최우선 목표로 목표를 수정하게 되었습니다.

LLM&RAG 강의를 완강 하였고

머신러닝의 PCA, k-means-clustering, DBSCAN, 계층적 군집화에 대한 복습을 마무리했습니다.

LDA, t-SEN의 결과해석은 아직 마무리 하지 못했지만 틈이 나는대로 진행할 예정입니다.

포트폴리오 또한 새로운 강의 수강 및 머신러닝 복습, 트러블 이슈 등으로 많이 진행하지 못한 상황으로 빠르게 정리하고 싶습니다.

2. 학습하며 가진 생각들

1) 머신러닝

  • 결과에 대한 해석을 위해선 수학개념을 이해하는게 중요해 보임
  • 왜 사용하는지? 어떻게 결과를 해석하는지 찾고 학습하는 과정이 매우 어려움
  • 코드의 파라미터 등의 기능은 어느정도 숙지했다고 생각함

2) 파이썬

  • 수준별 학습 반에서 진행하는 강의 및 과제로 학습 중
  • 과제를 혼자 풀어보고 다른 해석 및 튜터님의 풀이 방법 등을 보며 공부
  • 다양한 방법이 존재하는 것이 신기하고 실제 현장에서 주로 쓰는 방법이나 그라운드 룰 등에 대한 이야기가 신기했음
  • 많은 질문이 생각나지만 혼자 학습해보고 해결이 안되는 부분을 질문해서 학습 시간이 더 오래걸리나 싶은 생각이 들지만 이게 가장 좋은 학습 방법 같음

3) AI모델활용

  • 아직 API키 활용을 제대로 못하겟음
  • 항상 만나지만 아직 해결 못한 환경변수 설정 튜터님에게 질문해야할 것으로 보임
  • 신기하고 재미있어 보이지만 코드를 다 공부하기에 학습시간이 오래걸릴 것 같음

4) LLM&RAG

  • 1~4주차 강의는 쉽고 반복되는 내용으로 빠르게 이해가 가능했음
  • 5주차 강의 또한 반복되는 내용에 조금씩 내용이 깊어지고있다 생각함
  • 5주차 마지막 강의는 여러번 재수강이 필요해 보임
  • 내가 할 수 있을까? 라는 생각이 들기 시작함

5) 포트폴리오

  • GITHUB의 웹싸이트 만들기 까지 했지만 꾸미는 방법은 진행하지 못한 상태
  • 언젠간 해야지하면서 다른 학습에 시간을 다 사용해버려 진행이 너무 느림

3. 다음 주 목표

  • 머신러닝 t-SEN, LDA 결과 완벽히 해석
  • 환경변수 설정에 대한 내용 질문 및 찾아보기
  • LLM&RAG 필기한 내용을 주로 복습하고 개인과제가 나오면 집중 복습
  • 파이썬 강의에서 나오는 내용은 꾸준히 복습하고 다음주 주말에 문제 한번씩 다시 풀어볼 것

'WIL' 카테고리의 다른 글

내일배운캠프 WIL + 머신러닝  (0) 2024.10.27
내일배움캠프 2주차 WIL + 파이썬 데이터 정복  (4) 2024.10.13

목차

오늘의 TIL목차는

  1. 시작전 마음가짐
  2. LLM&RAG 강의
  3. 수준별 학습반
  4. 회고

입니다.

 

오늘의 강의 필기와 코드는 GITHUB링크를 참고해주세요.

 

TIL/ML at main · Onesword-Jang/TIL

오늘 배운 것은?! Contribute to Onesword-Jang/TIL development by creating an account on GitHub.

github.com

 

 

TIL/LLM/LLM_RAG_1.ipynb at main · Onesword-Jang/TIL

오늘 배운 것은?! Contribute to Onesword-Jang/TIL development by creating an account on GitHub.

github.com

 

 


시작전 마음가짐

오늘은 새로운 팀으로 이동하게 되는 날입니다.

 

다른분들에게 피해를 주지 않으려면 학습에 대한 열정가지고 열심히 해야겟습니다.

 

또한 오늘부터는 복습보단 새로운 강의를 듣는 것을 목표로 하며 수준별 학습반 강의 내용을 완벽히 이해하는것이 목표입니다.

 

그럼 학습을 시작하겟습니다.


LLM&RAG 강의

LLM & RAG 강의를 4주차까지 완강했습니다.

 

내일(토요일)을 사용해서 5주차 까지 완강예정입니다.

 

오늘 강의를 듣기 전에는 아직 앞선 강의들에 대한 이해도가 매우 맞다고 생각하고있어 벌써 다른 주제의 강의를 듣기에는 부담스럽다라고 생각했습니다.

 

하지만 막상 들어보니 강의 내용 자체는 지금까지 들어보았던 강의 중에서 가장 이해하기 쉬웠으며 실습 또한 매우 간단하여 재미있게 들었습니다.

 

아직 완강한게 아니라서 쉽다고 생각하는게 섣부를 수 있지만 재미있고 유익한 시간이였다고 생각합니다.

 

오늘 실습을 진행하며 만난 트러블은 System에 정보를 전달했음에도 Assistant의 답변에 적용이 되지 않았습니다.

 

이를 해결하기 위해 강의 내용을 생각하다가 이전 대화 내용을 기억하고 학습한다는 부분이 생각나 이전의 대화내용을 전부 삭제하고 실행하니 해결이 되었습니다.

 


수준별 학습반

1. 문자열 붙여서 출력하기

  • 문제없이 해결
str1, str2 = input().strip().split(' ')

if 1 <= len(str1) <= 10 and 1 <= len(str2) <= 10:
    print(str1, end="")
    print(str2)

다른 사람 정답

  • replace(): 특정 값을 다른 값으로 대체할 때 사용하는 함수
  • 문자열.replace(바꿀문자열, 새문자열, 바꿀_횟수)
print(input().strip().replace(' ', ''))

튜터님 풀이

result = "".join([str1, str2])
print(result)

2. 문자열 돌리기

  • 전혀 모르겟어서 검색을 통해 해결
str = input()
for char in str:
    print(char)

다른사람 정답

  • join메서드: 문자열을 결합할 때 사용하는 메서드
print('\n'.join(input()))

3. 홀 짝 구분하기

  • if문법이 헷갈렸지만 혼자 해냄
  • != 문법이 생각 나지않아 필기 찾아 봄
a = int(input())

a_1 = a % 2

if a_1 == 0:
    print(f"{a} is even")

elif a_1 != 0:
    print(f"{a} is odd")

다른사람 정답

  • 비트 연산자 &: 두 비트가 모두 1일 때만 결과가 1이 된다.
  • n&1을 이용해 n이 짝수인지 아닌지 검증 가능(짝수일때 0, 홀수일 때 1)
  • n & (1 << k)을 사용해 n의 k번째 비트가 1인지 확인가능
  • 이진법에 대한 공부 필요
  • 슬라이싱 기법: n&1 값을 시작 인덱스로 삼고, 그 이후에 2칸 간격으로 문자를 선택
n=int(input())
print(f"{n} is {'eovdedn'[n&1::2]}")

총평

  • 지금까지 배운 내용으로 충분히 해결 가능한 문제들도 틀림
  • 응용력이 많이 부족해보임

머신러닝 복습(t-SEN, LDA)

1. t-SEN 코드 중

tsne = TSNE(n_components=2, random_state=42)
  1. n_components=2는 TSNE 클래스의 매개변수로, 몇 차원으로 축소할 것인지 지정
sns.scatterplot(x=X_tsne[:, 0], y=X_tsne[:, 1], hue=y, palette='viridis', legend=None)
  1. legend=None은 데이터에 대한 범례가 그래프에 표시되지 않는다. (표시하려면 'full' 또는 'auto')
  2. 범례란? 데이터 그룹의 이름을 그래프에 표시하는 것을 의미
  3. [:, 0]은 첫 번째 열에 해당하는 모든 값을 선택

2. LDA 결과 해석

  • 우선 정리가 아직 끝나지 않았다.
  • 학습을 마무리하며 정리 내용을 확인 해본 결과 의도를 이해할 수 없고 내용이 뒤죽박죽이다.
  • 정확히 어떤걸 위해 사용하고 그 원리가 무엇인지 모르겟다.(어렴풋이는 알겟는데 다른 설명을 찾아보면 아니고...)
  • 내일 강의를 다 듣고 나서 다시 한번 도전 해볼 것이다.

회고

LLM&RAG 강의를 들으며

 

생각보다 접근하기 쉽고 이해하기 좋아서 빨리 끝낫고 Ai모델 활용을 통해 해보고 싶던 AI에게 인생상담 받아보기도 진행해서 아주 만족입니다.

 

그리고 강의 듣는 시간이 빨리 끝나 계획에 없던 머신러닝에 대한 복습도 진행했습니다.

 

머신러닝을 공부하며

 

t-SEN과 LDA의 코드는 이해가 완벽하게 끝났지만 결과 해석을 아직 이해하지 못했습니다. (아쉽..)

 

내일 마저 도전해보고 2개 중 1개는 이해하고싶습니다.

 

수준별 학습을 들으며

 

파이썬 기본 문법 등을 활용해서 문제풀이 강의였습니다.

 

과제롤 받아 혼자 풀어보고 다른 사람들의 풀이도 보며 굉장히 다양한 풀이 방법들이있구나 싶었는데 튜터님께서 보여주시는 방법도 또 다른 방법이여서 매우 놀랐습니다. (join함수와 %나머지 값을 활용하기)

 

자주 문제를 풀어보고 내 것으로 만들고 싶습니다.

 

감사합니다

☑️ 목차

오늘 TIL 순서는

  1. 시작전 마음가짐
  2. Python 과제
  3. 머신러닝
  4. 회고

입니다.

오늘은 따로 필기하거나 작성한 코드가 없습니다.


☑️ 시작전 마음가짐

오늘은 학습에 흐름이 끊기지 않고 한 주제에 매몰 되지않게 순서를 짜 보았습니다.

 

물론 진행하다가 트러블이나 궁금증이 생기면 다시 매몰 될 수 있지만 학습에 오히려 좋은 것 같습니다.

 

어제 하지못한 API키 활용은 꼭 해보고 싶습니다!

 

그럼 학습을 시작하겟습니다.


☑️ Python 과제

1. 대소문자 바꿔서 출력하기

  • 대 소 문자 변환 함수가 upper, lower가 생각나고 한번에 전체 문자열을 바꾸는 함수가 있었는데 라고 생각함
  • 생각나지 않아 검색해보고 swapcase함수를 찾음
  • NameError로 swapcase() 작성 문법 틀려서 메서드 형태로 적용하고 해결
    str = input()
    str_swap = str.swapcase()
    while True:
      if len(str) >= 1 and len(str) <= 20:
          print(str_swap)
          break
      else:
          print('20자 이내의 영어문자만 입력하세요.')
          str = input()
          str_swap = str.swapcase()
          continue

2. 특수 문자열 출력

  • 특수 문자를 그대로 출력하는 방법을 몰라서 검색을 통하여 해결
  • \ 문자열은 \뒤에\를 붙이는 방식으로 출력 가능하는걸 알게 되었습니다. 하지만 너무 복잡해져서 더 알아보고 r string 방법을 찾았습니다.

3. 덧셈 식 출력하기

  • 이 문제는 모르는 부분 없이 금방 완료!!
  • 조건식을 간단하게 하는 방법을 찾아봄 1 <= a <= 100 and 1 <= b <= 100:
    a, b = map(int, input().strip().split(' '))
    if a >= 1 and a <= 100 and b >= 1 and b <= 100:
      print(f'{a} + {b} = {a + b}')

☑️ AI모델활용

강의를 3주차 1강까지 들었습니다.

강의를 들으며

  • 새로운 가상환경을 만들었습니다.
  • numpy 버젼 호환 문제가 발생하여 호환 가능한 버젼으로 다운 그레이드 해주었습니다.
  • transformers와 torch의 호환 문제로 호환되는 버젼으로 다운 그레이드 해주었습니다.
  • 다운그레드 과젱어서 torch vision과 오디오버젼에 문제가 생겼지만 당장 사용하지 않는 라이브러리들이라 변경하지 않았습니다.
  • 3-1까지 설명한 오류는 제외하면 깔끔하게 진행했습니다.
  • API키를 활용하는 모델이 나오지 않아 슬랙 질문방에 공유해주신 코드를 실행해보고 문제 없음을 알게 되었습니다.
  • 내일은 남은 강의를 들으며 나오는 코드와 공유받은 코드의 내부를 내가 바꾸고 싶은대로 해보는게 목표입니다.

☑️ 회고

오늘은 밍글데이로 약간의 쉬어가는 날이였습니다.

 

오늘 밍글데이라는걸 잊어버리고 계획을 잡아 머신러닝 복습과 포트폴리오 도전을 진행하지 못했습니다.ㅜㅜ

 

또한 새로운 챕터 발제가 있었고 내일부터 또 다른 강의를 수강해야할 것으로 보입니다.

 

아직 머신러닝도 복습 마무리 못했는데...

 

우선 강의를 1회 반복을 빠르게 진행하고 다른 복습을 진행하는게 진도 맞추기에 좋을것 같아 원래 한 주 계획이였던 포트폴리오와 머신러닝 복습은 미루어야겟습니다.

 

그리고 수준별 학습 강의를 진행했는데 처음 나오는 과제라서 문제없이 쉽게 풀었지만 튜터님께서 내가 생각한 한가지 방법말고도 여러 방법, 함수 등을 보여 주셨습니다.

 

하루를 마무리할 때 목표는 그 날 수준별 학습 강의 내용을 내 것으로 만들고 마무리하는 것으로 진행 예정입니다.

 

감사합니다.

+ Recent posts