Matemática para redes neurais (feedforward)

Aprendizado por reforço para aplicações em redes neurais

Prof. Hallison Paz

8 de fevereiro de 2024

Sobre mim

Hallison Paz

  • Engenheiro de computação (Instituto Militar de Engenharia)
  • Mestre e doutorando em Matemática (IMPA)
  • Criador do canal (Youtube)
    Programação Dinâmica
  • Trabalhei no Reality Labs Research (Meta)
black

"SOMOS A FACULDADE QUE FORMA OS LÍDERES DO FUTURO."

Mapeamento de competências da Turma

  • Inglês
  • Python
  • Matemática

https://forms.gle/xzbykAzUzAJvxBZX7

Por que estudar o que a gente vai estudar?

O que é uma rede neural?

Como isso nos ajuda a resolver problemas?

Forward Propagation

Função de ativação

Por quê?

Função de ativação

Exemplos

O que não pode ser uma função de ativação?

Perceptron Multicamada

(Multilayer Perceptron)

Perceptron Multicamadas

Multilayer Perceptron (MLP)

Questão Ponderada - parte 1

Você foi contratado por uma startup de tecnologia de saúde que está desenvolvendo um algoritmo de aprendizado profundo para detectar anomalias em imagens de raios-X. Durante a fase de prototipagem, a equipe decidiu usar a função de ativação ReLU nas camadas ocultas de sua rede neural.

Após algumas iterações, você observa que muitos neurônios na rede estão "morrendo" durante o treinamento, ou seja, eles estão sempre produzindo uma saída zero, independentemente da entrada.

Questão Ponderada - parte 2

a) Explique por que a função ReLU pode causar o "morte" de neurônios durante o treinamento.
b) Sugira uma modificação ou alternativa à função ReLU para mitigar esse problema.
c) Descreva como essa modificação ou alternativa pode beneficiar o treinamento do modelo, especialmente em um contexto de detecção de anomalias em imagens médicas.

Bibliografia complementar

  • Goodfellow, Ian, Yoshua Bengio, and Aaron Courville. Deep Learning. Cambridge, MA: MIT Press, 2016. Chicago (author-date), 17th ed.

combinação, produto escalar, matrizes, linear, não-linear, entrada, saída

composição de funções, multiplicação de matrizes, transformações lineares