AWSKRUG Meetup (9/9/2020)

1. Hands-On ML Chapter 6 - κ²°μ • 트리

λ°œν‘œμž: 11λ²ˆκ°€ μ΄μ£Όκ²½λ‹˜

1-2. λ°œν‘œλ₯Ό λ“€μœΌλ©° μƒˆλ‘­κ²Œ μ•Œκ²Œ 된 점

κ²°μ • 트리 ν•™μŠ΅κ³Ό μ‹œκ°ν™”

  • Logistic regression, SVM (Support Vector Machine) 은 μ„ ν˜•λͺ¨λΈ 의 각 νŠΉμ§•λ³„ κ°€μ€‘μΉ˜ λ₯Ό ν•™μŠ΅ν•˜λŠ” 방식

  • Tree λ₯Ό λ§Œλ“€κΈ° μœ„ν•œ 각 νŠΉμ§•λ³„ 쑰건을 ν•™μŠ΅ν•œλ‹€!

Decision Tree의 μ§€λ‹ˆ λΆˆμˆœλ„ (Gini Impurity) λž€?

  • μ§€λ‹ˆ λΆˆμˆœλ„ μΈ‘μ • (Gini Impurity Measure) 은 λΆ„λ₯˜λ¬Έμ œμ—μ„œ μ‚¬μš© κ°€λŠ₯ν•œ κ²°μ • 트리 (Decision Tree)의 λΆ„ν•  κΈ°λΆ„ (Split Criteria) 쀑 ν•˜λ‚˜μ΄λ‹€

  • Decision Treeμ—μ„œ μ‚¬μš©λ˜λŠ” class의 κ°œμˆ˜μ— λ”°λ₯Έ caseλ“€μ˜ λΆˆμˆœν•œ 정도 λ₯Ό λ‚˜νƒ€λ‚΄λŠ” 척도이닀

  • μ§€λ‹ˆ λΆˆμˆœλ„λŠ” classμ•ˆμ— λΆ„λ₯˜κ°€ 잘 λ˜μ–΄ 있으면 0이 λœλ‹€

    • λΆˆμˆœλ¬Όμ—†μ΄ κΉ¨λ—ν•˜κ²Œ λΆ„λ₯˜κ°€ λ˜μ–΄μžˆλ‹€λŠ” 뜻!

      • but, μ„žμ΄κ²Œ 되면 0보닀 큰 값을 κ°–κ²Œ λœλ‹€ (μ΅œλŒ€κ°’μ€ 0.5)

규제 λ§€κ°œλ³€μˆ˜

  • ν›ˆλ ¨ 데이터에 λŒ€ν•œ κ³ΌλŒ€ 적합을 ν”Όν•˜κΈ° μœ„ν•΄ ν•™μŠ΅ν•  λ•Œ κ²°μ • 트리의 μžμœ λ„ λ₯Ό μ œν•œν•  ν•„μš”κ°€ μžˆλ‹€

  • 규제 λ§€κ°œλ³€μˆ˜ λŠ” μ‚¬μš©ν•˜λŠ” μ•Œκ³ λ¦¬μ¦˜μ— 따라 λ‹€λ₯΄μ§€λ§Œ, 보톡 적어도 decision tree의 μ΅œλŒ€ κΉŠμ΄λŠ” μ œμ–΄ν•  수 μžˆλ‹€

    • Scikit learnμ—μ„œλŠ” max_depft λ§€κ°œλ³€μˆ˜λ‘œ μ‘°μ ˆν•œλ‹€

      • defaultλŠ” μ œν•œμ΄ μ—†λŠ” 것을 μ˜λ―Έν•˜λŠ” None

      • max_depth λ₯Ό 쀄이면 λͺ¨λΈμ„ κ·œμ œν•˜κ²Œ 되고, κ³ΌλŒ€ μ ‘ν•© 의 μœ„ν—˜μ΄ κ°μ†Œν•œλ‹€!

2. Introducing MLOps

λ°œν‘œμž: superb Ai μ°¨λ¬Έμˆ˜λ‹˜

2-2. λ°œν‘œλ₯Ό λ“€μœΌλ©° μƒˆλ‘­κ²Œ μ•Œκ²Œ 된 점

  • Launching is easy, Operation is hard

    • μ„œλΉ„μŠ€λ₯Ό κ³ λ„ν™”ν•˜κ³  μš΄μ˜ν•˜λŠ” 것이 μ–΄λ ΅λ‹€

  • DevOps 처럼 λ‚˜μ˜€κ²Œ 된 MLOps

    • μ‹€μ œλ‘œ μ„œλΉ„μŠ€ν•˜λŠ”λ°κΉŒμ§€ μ‹œκ°„μ΄ λ„ˆλ¬΄ μ˜€λž˜κ±Έλ¦¬λ―€λ‘œ

    • 개발 - 운영 을 같이 ν•˜κΈ° μœ„ν•œ pipeline 의 ν•„μš”μ„±μ΄ λŒ€λ‘λ˜μ–΄ λ“±μž₯!

Last updated