MNIST 데이터로 해보는 CNN (Convolution Neural Network)
·
AI/Computer Vision
CNN (Convolution Neural Network)CNN이미지 영상인식의 혁명같은 CNNCNN은 이미지의 특징을 검출하여, 분류하는 것 CNN은 특징을 찾는 레이어와 분류를 하는 레이어로 구성됨 Convolutional FilterConvolution : 특정 패턴이 있는지 박스로 훑으며 마킹하는 것위 아래선 필터, 좌우선 필터, 대각선 필터, 각종 필터로 해당 패턴이 그림위에 있는지 확인필터는 이미지의 특징을 찾아내기 위한 파라미터 위 그림에서는 주황색의 3 x 3 행렬 (CNN에서 Filter와 Kernel은 같은 의미로 사용됨)필터는 일반적으로 4 x 4 or 3 x 3과 같은 정사각 행렬로 정의됨.CNN에서 학습을 통해 필터를 구할 수 있음CNN은 입력 데이터를 지정된 간격으로 순회하며 채..
N-gram 이해하기
·
AI/Natural Language Processing
N-gram이란?n-gram은 텍스트나 시퀀스에서 연속적으로 나타나는 n개의 항목(단어, 문자 등)을 의미한다. n-gram은 한 단어 이상의 단어 시퀀스를 분석 대상으로 한다. 예를 들어, "I love programming"이라는 문장에서 2-gram(bigram)은 "I love", "love programming" 등이 된다. n-gram은 텍스트의 구조와 패턴을 파악하는 데 유용하여 자연어 처리에서 많이 사용된다. n의 크기에 따라 unigram(1-gram), bigram(2-gram), trigram(3-gram) 등으로 나타낼 수 있다. 마르코프 가정n-gram에서 중요한 개념 중 하나는 마르코프 가정이다. 마르코프 가정은 주어진 시퀀스에서 다음 상태나 사건의 확률이 오직 현재 상태에만 의..
프롬프트 엔지니어링 이해하기
·
AI/Natural Language Processing
프롬프트 엔지니어링은 인공지능(AI)에게 특정 작업을 수행하도록 지시하는 기술로, 사용자가 원하는 결과를 정확히 얻기 위해 설계된 지침을 제공하는 것을 말합니다. 이를 통해 AI 모델은 사용자의 의도를 이해하고, 적합한 응답을 생성할 수 있습니다. 이 기술은 특히 생성형 AI와의 상호작용에서 핵심적인 역할을 하며, AI가 복잡한 요청을 처리하는 데 필요한 방향성을 제공합니다.프롬프트 엔지니어링의 중요성프롬프트 엔지니어링은 AI가 단순히 데이터를 처리하는 데 그치지 않고, 사람과의 협업을 통해 문제를 해결하는 데 활용될 수 있도록 돕습니다. 잘 설계된 프롬프트는 다음과 같은 장점을 제공 합니다.프롬프트 엔지니어링의 주요 장점높은 정확성명확하고 구체적인 지침을 통해 사용자는 더욱 정확한 정보를 얻을 수 있습..
PCA, t-SNE, LDA으로 알아보는 차원 축소
·
AI/Machine Learing
차원 축소는 데이터의 차원을 줄여서 데이터를 간결하게 만드는 기술이다. 시각화, 데이터 축소, 노이즈 제거, 성능 향상 및 계산 시간 감소를 위해 사용한다. 대표적인 차원 축소 알고리즘으로는 PCA, t-SNE, LDA가 있으며, 각 알고리즘은 장점과 단점이 있다. 차원 축소는 머신 러닝 모델의 성능에 긍부적 적인 영향을 미치며, 특성 선택과 차원 축소는 정보 유지와 계산 효율성 측면에서 차이가 있다.서론차원의 저주보통 우리가 생각하는 데이터는 여러 가지 정보로 이루어져 있다. 온라인 쇼핑 사이트에서 상품을 구매할 때를 예를 들자면 상품의 가격, 색상, 브랜드, 평점 및 후기 등 여러 정보가 있다. 이러한 정보를 차원이라고 한다. 하지만 데이터의 차원(정보)이 많아질수록 데이터가 복잡해져 분석하거나 활용..
Penn-Fudan으로 알아보는 객체 탐지(Object Detection), 분할(Segmentation) with FasterRCNN
·
AI/Computer Vision
해당 게시물은 Torch Vision의 객체 감지 미세조정 튜토리얼을 참고하여 작성되었습니다.Pytorch에서 제공하는 Coco 데이터로 사전 훈련된 FasterRCNN을 활용하여 보행자 감지(detection) 및 분할(segmentation)을 위해 Penn-Fudan 데이터로 파라미터 튜닝을 진행합니다. Penn-Fudan 데이터는 345개의 보행자 정보가 포함된 총 170개의 이미지가 포함되어 있습니다.실습 준비Download최초 1회 아래의 주석을 풀어 cutom function과 Penn-Fudan 데이터를 다운로드합니다.# !wget https://raw.githubusercontent.com/pytorch/vision/main/references/detection/engine.py# !wg..