10web
10web
Ricardo Correia e Vitor Silva
Programa 20 – Data Science
1 seconds Posted Jan 29, 2017 at 9:08 pm.
]
]
]
]
]
]
]
]
]
]
]
]
]
0:00
0:01
Download MP3
Show notes
(download)
Neste 20º episódio estivemos à conversa com Daniel Costa, Data Scientist  na MOG.
Nos dias de hoje, esta área está difundida por todas as aplicações que usamos diariamente. As sugestões de novas conexões no LinkedIn, a construção do newsfeed no Facebook, ou as sugestões de quem podemos seguir no Twitter são alguns exemplos. Daí a nossa vontade de conhecer como é que tudo funciona na prática.
Começámos por falar sobre o percurso profissional do Daniel, sobre o papel e os desafios de um Data Scientist. Falámos ainda sobre o processo de recolha e tratamento dos dados, e das diferentes ferramentas que usa no seu trabalho.
Links úteis
Tecnologias para projetos de streaming:
Kafka: https://kafka.apache.org/
Rabbit Message Queue: https://www.rabbitmq.com/
Modelo de dados descritivos:
Avro: https://avro.apache.org/
Thrift: https://thrift.apache.org/
Os “chavões” do Data Science:
Hadoop: http://hadoop.apache.org/
MapReduce: https://research.google.com/archive/mapreduce.html
Hive: http://hive.apache.org/
Pig: http://pig.apache.org/
Mahout: http://mahout.apache.org/
Tópicos abordados
Percurso profissional [
O que faz um Data Scientist [
Principais desafios [
Crescimento da recolha e coleção de dados [
A MOG, e os tipos de dados interessantes para o negócio [
Recolha e processamento de dados [
Tecnologias de Data Science usadas na MOG [
Hadoop, MapReduce, Hive, Pig… o que são? [
Visualização dos dados [
Machine Learning [
Questões respondidas por Data Science [
Aplicações práticas de Data Science [
Perguntas Rápidas [
Perguntas Rápidas
Expectativas para os próximos 12 meses a nível de web?
Data Science na cloud, acessível a todas as empresas
Qual a app mobile que não dispensarias?
Spotify
Qual a ferramenta de desenvolvimento/produtividade mais indispensável para o teu dia-a-dia?
Git (Gitlab)
Um podcast ou livro fundamental?
Podcast: 10web
Livro: sobre Social Engineering, por exemplo: Art of Human Hacking 
Conferência a não perder
Conferências Google e Apache
Sugestão de próximo convidado
Sobre Docker, Miguel Poeira da MOG
O post Programa 20 – Data Science aparece primeiro no 10web.