CV & NLP 선택가이드 - 업스테이지 서대원, 박선규

CV 도메인에 대하여 (박선규)

흔히 볼 수 있는 컴퓨터비전 태스크에 대한 사진

image-20210810154314326

Taskonomy (CVPR 2018 Best Paper)

image-20210810154528914

  • 컴퓨터 비전에 관련된 26개의 태스크를 하나하나 정의하고, 한 태스크로의 모델을 학습시킨 후 전이학습에 대한 성능을 기준으로 두 태스크에 대한 관계(유사도)를 분석한 논문임.
  • 태스크에 대한 연관관계보다는 태스크가 이렇게 많았구나..라는 인사이트를 얻게 됨.
  • 이렇게 태스크가 많은데도, 학회를 가면 항상 새로운 것을 보게 됨. 연구분야가 굉장히 넓고 다양하다.

이미지에 관련된 것은 Convolution에 굉장한 의존성을 가지고 있다. 즉, Detection과 Segmentation 정도만 배우더라도 다른 컴퓨터비전 태스크를 접할 때 큰 어려움 없이 접할 수 있다.

OCR

image-20210810155113892

ViT

자세히 보기

뉴럴 네트워크 - Multi Layer Perceptron

Neural networks are computing systems vaguely inspired by the biological neural networks that constitute animal brains.

자세히 보기

그리스문자 정리

문자영어한글로마자 표기법
Α αAlpha알파a
Β βBeta베타b
Γ γGamma감마gh, g, j
Δ δDelta델타d, dh
Ε εEpsilon엡실론e
Ζ ζZeta제타z
Η ηEta에타i
Θ θTheta쎄타th
Ι ιIota요타i
Κ κKappa카파k
Λ λLambda람다l
Μ μMum
Ν νNun
Ξ ξXi크시x, ks
Ο οOmicron오미크론o
Π πPi파이p
Ρ ρRhor
Σ σ ςSigma시그마s
Τ τTau타우t
Υ υUpsilon입실론y, v, f
Φ φPhif
Χ χChi카이ch, kh
Ψ ψPsi프사이ps
Ω ωOmega오메가o
자세히 보기

RNN 첫걸음

시퀀스 데이터

  • 소리, 문자열, 주가 등처럼 순차적으로 나타나는 데이터를 시퀀스 데이터로 분류한다.
  • 독립동등분포(i.i.d.) 가정을 잘 위배하기 때문에 순서를 바꾸거나 과거 정보에 손실이 발생하면 데이터의 확률분포도 바뀌게 된다.
  • 이전 시퀀스의 정보를 가지고 앞으로 발생할 데이터의 확률분포를 다루기 위해 조건부확률을 이용할 수 있다.

  • 시퀀스 데이터를 다루기 위해선 길이가 가변적인 데이터를 다룰 수 있는 모델이 필요하다.

    $H_T = Net_\Theta(H_{t-1}, X_{t-1})$​

  • 시퀀스 길이가 길어지면 BPTT를 통한 역전파 알고리즘의 계산이 불안정해지므로 길이를 끊는 것이 필요하다. (truncated BPTT)

  • 이러한 문제들 때문에 Vanila RNN은 길이가 긴 시퀀스를 처리하는데 문제가 있다.

    • 이를 해결하기 위해 등장한 것이 LSTM과 GRU이다.
자세히 보기