내일배움캠프 36일차 TIL + Pytohn,특강(LLM, API), 개인과제(LLM), prompt engineering

onesword 2024. 11. 15. 21:01

2024. 11. 15. 21:01

시작전 마음가짐

오늘의 학습은 개인과제에 집중을 할 것입니다.

최대한 개인과제에 필요하고 메모해 놓았던 부분들을 실행시키는 것이 목표입니다.

python문제와 수준별학습반의 prompt강의도 궁금하네요

학습을 시작하겟습니다.

Python 문제풀이

1. 등차수열의 특정 항 더하기

range함수로 등차수열을 정의 했는데 값이 true, false이면 정의가 안됨
등차 수열을 계산하는 코드식 찾아보고 해결

# 첫 번째
def solution(a, d, included):
    answer = range(a, len(included), d)
    for i in rnage(len(included)):
        if included[i]:
            return sum(answer[i + 1])

# 두 번째
def solution(a, d, included):
    answer = 0
    for i in range(len(included)):
        if included[i]:  
            answer += a + i * d  
    return answer

2. 주사위 게임

random함수를 사용해서 풀어보려 했으나 random으로 출력한 값을 변수로 지정하는 방법을 찾지못함
하나씩 정의해가면 해결

def solution(a, b, c):
    ran_1 = a + b + c
    rna_2 = a**2 + b**2 + c**2
    ran_3 = a**3 + b**3 + c**3

    if a == b == c:
        return ran_1 * rna_2 * ran_3
    if a == b or b == c or a == c:
        return ran_1 * rna_2
    else:
        return ran_1

3. 원소들의 곱과 합

고민은 조금있었지만 완료

def solution(num_list):
    answer_1 = sum(num_list)**2

    answer_2 = 1
    for num in num_list:
        answer_2 *= num

    if answer_1 > answer_2:
        return 1
    else:
        return 0

LLM 특강 1강

1. LLM은 어떻게 딥러닝을 통해 구현될 수 있었을까?

DNN(딥러닝): 입력층 -((가중치)> 은닉층....->출력층
언어 모델에는 RNN을 보통 사용한다.
과정: 데이터가 커지면서 기울기 소실문제가 발생해 해결하기 위한 방법이 나옴
- LSTM
- GRU
- 하지만 RNN의 구조적인 한계(장기 의존성, 기울기 소실 문제)로 완전히 극복하지 못함
- 그래서 Attention 기법의 도입
Transformers: RNN을 빼버리고 Attention만을 사용한 모델을 만들었는데 성능이 더욱 뛰어났다.
- 앞의 노드 점수를 계산할 필요가 없어짐
- 모든 노드의 점수를 동시에 계산할 수 있게 됨(GPU)
- 장기의존성, 기울기 소실문제 개선
결론: Transformers를 이용해서 데이터 사용양을 늘리수있었고 그로인해 LLM을 만들 수 있게 되었다.

2. LLM은 어떤식으로 배우게 되나요?

공식 문서를 보고 코드를 쓸 줄 알아야한다.

3. LLM활용의 기본적인 컨셉트

Text Completion(텍스트 완성)에 특히 강점을 가지고있음
- 맥락(Context)를 읽고 다음에 올 단어를 예측하여 문장을 완성하는 것
- Context로 줄 수 있는 토큰의 사이즈가 커지니 다양한 일들이 가능해짐 ex) Prompt
Prompt: 사용자 질문만이 아니라 Prompt에 설정 된 문맥까지 다 읽고 기능
- user
- System
- Assistant
Token 단위로 prompt를 읽어 온다.

4. LLM 사용해보기

OpenAI Platform의 공식 문서를 사용해서 코드 및 파라미터의 정보를 읽는 방법에 대한 내용으로 진행 되었습니다.
실습 진행한 링크 https://colab.research.google.com/drive/17i_9NgVYpYhEQZCM7V6brIjhXxPCsd9H#scrollTo=PcBAopj27VMs

개인과제 (LLM)

수정 필요!

백업 스토어 설정에서 InMemoryDocstore를 사용해보기
리트리버 변환에서 다른 변환 방법 찾아보고 적용 및 비교해보기
답변 방식을 바꾸는 프롬프트 방법 찾아보기
대화형 Chat봇 코드와 비교해 보았을 때 오히려 가독성이 떨어지게 출력이 되어 프롬프트 수정이 필요해 보임
백터 스토어 생성에서 FAISS.from_documents 대신 FAISS.from_embeddings 사용해서 결과 비교해보기
랭스미스 API키 받아서 LLM평가해보기

수정 진행!

1. InMemoryDocstore를 사용해보기

# 벡터 스토어 생성
from langchain_community.vectorstores import FAISS
from langchain_community.docstore.in_memory import InMemoryDocstore

vector_dim = len(embeddings.embed_query("example text")) 
index = faiss.IndexFlatL2(vector_dim)

vector_store = FAISS(
    embedding_function=embeddings,
    index=index,
    docstore=InMemoryDocstore(),
    index_to_docstore_id={}
)

2. 파라미터 조정

retriever = vector_store.as_retriever(search_type="similarity", search_kwargs={"k": 2})

model = ChatOpenAI(model = "gpt-4o-mini", temperature = 0.3, max_tokens = 1000, stream = True)

3. 프롬프트에 추가한 명령

system: 인공지능 모델 연구자이십니다. 이 문서에서는 발전, 과제 및 주요 기여를 포함하여 초대형 언어 모델의 최신 연구 동향을 설명합니다. 귀하의 임무는 문서를 분석하고 상세하고 통찰력 있는 답변을 제공하는 것입니다.
user: 본 문서에 언급된 주요 동향과 연구 결과를 중심으로 포괄적인 답변을 부탁드립니다.

contextual_prompt = ChatPromptTemplate.from_messages([
    ("system", "You are an artificial intelligence model researcher. The document describes the latest research trends in super-large language models, including advancements, challenges, and key contributions. Your task is to analyze the document and provide a detailed and insightful response."),
    ("user", "Context: {context}\n\nQuestion: {question}\n\nAnswer: Please provide a comprehensive response, focusing on the key trends and research findings mentioned in the document.")
])

수준별 학습반

Prompt 점수 측정 방법

baseline prompt 작성
다른 모델 prompt의 답변을 저장한다.
Rouge, G-Eval 사용하여 점수를 받고 프롬프트를 수정하며 점수를 높여간다.
결론: 실습코드를 중간에 놓쳐서 완벽하게 따라해보지는 못했지만 어느정도 이해가 되는 수업이였습니다. 놓친 부분은 주말에 1~3강 복습을 해보고 개인과제에 적용을 하고 남은 기간동안 프롬프트 엔지니어링 과정을 문서화하는것을 복표로 해보아야겟습니다.

회고

전체적으로

오늘 학습은 꽤나 알찻다고 생각합니다.

오전 10시에 진행한 LLM특강 오후 7시에 진행한 API키 특강 오늘은 특강이 2개나 진행 되었고 수준별 학습반에서도 prompt engineering에 대한 강의가 있었습니다.

모든 정보를 이해했다고는 할 수 없지만 대부분은 이해가 가능했다고 말할 수 있습니다.

Python 문제풀이를 하며

아직 기본기가 부족한 것 같습니다.

잠시 헷갈린거지만 바로 행동으로 옮겨지지 않은건데요 그것이 바로 기본인 리스트를 활용하는 방법과 연산기호를 사용해 결과를 가져오는 부분이였습니다.

지금까지 문제를 풀며 나온 작성법들과 혼동이 와서 그런 것 같습니다.

다음에는 이러한 기본적인 부분은 바로 사용방벙이 생각 날 만큼 학습을 진행야할듯합니다.

특강을 들으며 오늘은 2가지의 특강을 들었습니다.

오전의 LLM특강은 지금까지 궁금했던 LLM과 딥러닝의 연관성에 대한 내용이 나와서 흥미롭고 높은 이해도로 가져갈 수 있었습니다.

API특강은 우리가 친숙하게 사용했던 싸이트들의 API키를 발급 받고 사용방법 및 공식 API키 관련 문서읽는 방법에 대하여 알려주셨습니다.

각 싸이트마다 조금씩 다른 점이있지만 API키를 불러오는 방법의 진행방식이 매우 비슷하다 생각 들었습니다.

개인과제를 진행하며

개인과제 LLM에 대한 진도는 크게 나가지 않았지만 지금까지 진행하며 필요하다고 생각한 수정이 필요한 부분들이 필요한지 다음 단계에서 진행해야하는 것인지에 대해서 파악할 수 있었습니다.

또한 내가 만든 RAG체인을 활용한 대화형 LLM모델에 직접적으로 프롬프팅 엔지니어링을 하는 방법을 알게 되었습니다.

수준별 학습반 수업을 들으며

실습코드를 중간에 놓쳐서 완벽하게 따라해보지는 못했지만 어느정도 이해가 되는 수업이였습니다.

놓친 부분은 주말에 1~3강 복습을 해보고 개인과제에 적용을 하고 남은 기간동안 프롬프트 엔지니어링 과정을 문서화하는것을 복표로 해보아야겟습니다.

'TIL' 카테고리의 다른 글

내일배움캠프 38일차 TIL + Python, LLM특강, 개인과제(완료) (0)	2024.11.19
내일배움캠프 37일차 TIL + Python, LLM특강, 개인과제(LLM) (0)	2024.11.18
내일배움캠프 35일차 TIL + Python, LLM 개인과제, prompt engineering (2)	2024.11.14
내일배움캠프 34일차 TIL + Python, 개인과제(LLM), 수준별 학습반(프롬프트) (2)	2024.11.13
내일배움캠프 33일차 TIL + Python, 머신러닝(t-SEN), AI모델활용, 크롤링 (4)	2024.11.12

onesword 님의 블로그