SOBRE AS DISCIPLINAS

MÓDULO 1

  • Estatística Aplicada

    Ementa: Estatística descritiva, teoria das probabilidades e inferência estatística.
    Objetivos: Revisar conceitos básicos da teoria das probabilidades e apresentar um conjunto de técnicas de estatísticas para tirar conclusões sobre os dados com apoio computacional.

  • Álgebra Matricial e Métodos Numéricos

    Ementa: Introdução à álgebra matricial. Espaços vetoriais. Transformações lineares. Métodos exatos e iterativos para resolver sistemas de equações lineares e obter autovalores e autovetores.
    Objetivos: Fornecer os fundamentos de álgebra linear necessários para o desenvolvimento teórico de técnicas estatísticas utilizadas em Ciência de Dados, como a análise de conglomerado (e.g., distância euclidiana e de Mahalanobis), a análise fatorial exploratória (e.g., autovalores e autovetores, rotação de soluções e decomposição em valores singulares) e outras. Apresentar os métodos numéricos comumente utilizados para resolver sistemas de equações lineares e obter autovalores e autovetores.

  • Programação em R e Python

    Ementa: Conceitos básicos de programação na plataforma computacional R (www.r-project.org/) e Python (https://www.python.org/). Estruturas de controle e repetição, funções, objetos, classes, métodos e manipulação de dados.
    Objetivos: Fornecer técnicas de programação usando a plataforma computacional R (www.r-project.org/) e Python (https://www.python.org/). A escolha destas linguagens como veículo para aprender a realizar programas estatísticos é seu intenso uso dentro da análise de informação últimos anos. Ao usarem uma ferramenta deste género como plataforma de implementação dos conceitos aprendidos, os alunos poderão facilmente, levar o que aprenderam para o cenário profissional em que se enquadram ou venham a enquadrar.

  • Banco de Dados I (SQL e NoSQL)

    Ementa: Introdução aos sistemas de gerência de banco de dados SQL e NoSQL.
    Objetivos: Introduzir os principais conceitos, técnicas e ferramentas de gerência de dados estruturados e não estruturados. O curso visa prover teoria e prática a fim de que os alunos possam aplicar as novas técnicas e ferramentas estudadas na solução de problemas reais.


MÓDULO 2

  • Aprendizado de Máquina

    Ementa: Introdução aos métodos de aprendizado supervisionado e não supervisionado bem como suas aplicações.
    Objetivos: Neste curso iremos apresentar uma variedade de técnicas de aprendizado supervisionado e não supervisonado, bem como procecimentos mais avançados como seleção de variáveis, regularização e métodos combinados.

  • Fundamentos de Big Data

    Ementa: Introdução a Big Data, Métodos de amostragem em Big Data e Método de processamento em paralelo.
    Objetivos: Proporcionar ao aluno conhecimentos recentes em fundamentos e manuseio de grande volume de dados.

  • Banco de dados II (Data Warehousing)

    Ementa: Conceitos básicos. Os Ecossistemas de Informação. O Ciclo de Vida do DW: Planejamento e Administração, Modelagem Dimensional e Implementação. Sistemas de Informação.
    Objetivos: Aplicar os conhecimentos obtidos na disciplina para aplicação na concepção, elaboração, construção e transição de Data Warehouse e Data Marts.

  • Exploração e Visualização de Dados

    Ementa: Introdução à visualização e exploração de dados; Web e D3; Visualização de dados temporais; Visualização de dados espaciais; Visualização de texto; e aplicações em big data.
    Objetivos: Neste curso iremos apresentar uma variedade de técnicas e estratégias para explorar e visualizar conjuntos de dados grandes e complexos.

  • Mineração de texto

    Ementa: Introdução à mineração de texto; Pré-processamento de texto e extração de informação; Categorização de texto; Agrupamento de texto; Modelagem de tópicos; Análise de sentimento; Visualização de texto e Aplicações.
    Objetivos: Neste curso iremos apresentar uma variedade de princípios, técnicas e avanços atuais em mineração de texto.



MÓDULO 3

  • Processamento Massivo Paralelo (Hadoop e mapReduce)

    Ementa: Visão geral sobre Hadoop, Instalação do Apache Hadoop, Hadoop distributed File System – HDFS, MapReduce.
    Objetivos: Levar aos alunos uma visão geral do uso do Hadoop e seu ecossistemas de aplicações e sua implementação e uso na solução de problemas corporativos.

  • Introdução à Inteligência Artificial

    Ementa: Introdução a inteligência artificial; redes neurais artificiais; lógica nebulosa; algoritmos bio-inspirados; Aplicações
    Objetivos: Neste curso será apresentada uma abordagem prática às diferentes técnicas de inteligência artificial aplicadas em problemas de análise de dados, modelagem e reconhecimento de padrões.

  • Reconhecimento de Padrões de Imagem, Som e Vídeo

    Ementa: Introdução ao reconhecimento de padrões; Processamento Digital de Imagens; Processamento de Voz; Processamento de Sinais; Processamento de vídeo; Aplicações de reconhecimento de padrões.
    Objetivos: Neste curso iremos apresentar uma variedade de técnicas e estratégias para extração de atributos para o reconhecimento de padrões em imagem, som e vídeo, bem como a aplicação de métodos de aprendizado de máquina nesse contexto.

  • Estudo orientado

    Ementa: Desenvolvimento de atividades visando à confecção da Monografia de Conclusão da Especialidade em Ciência de Dados.
    Objetivos: Compreender, analisar e elaborar projetos de pesquisa. Desenvolver no discente a capacidade de elaborar projetos de pesquisa, bem como, os aspectos da escrita científica. Elaborar o projeto de pesquisa que será executado na monografia de conclusão de curso sob a orientação do professor-orientador.


Trabalho de Conclusão de Curso (TCC)

O Trabalho de Conclusão de Curso (TCC) será avaliado por uma banca examinadora, em que a nota mínima para aprovação é 7,0.