Giter Site home page Giter Site logo

mistersoftware / knowledge-studio Goto Github PK

View Code? Open in Web Editor NEW

This project forked from ibmdevelopermx/knowledge-studio

1.0 1.0 0.0 45.11 MB

Hace una extracción de información necesaria con modelos personzalidos en texto no estructurado

Java 9.99% CSS 82.80% JavaScript 7.21%

knowledge-studio's Introduction

IBM Cloud powered

Watson Knowledge Studio

Enseñe a IBM Watson el lenguaje con modelos personalizados que identifican entidades y relaciones exclusivas de su industria en texto no estructurado. Construya modelos en un entorno de colaboración diseñado para desarrolladores y expertos, sin necesidad de escribir código.

IBM Cloud Watson Discovery Demo Discovery

Antes de empezar te recomendamos:

  • Si eres estudiante o profesor y tienes correo institucional te recomendamos los Cupones.
  • Si tienes algun codigo promocional te decimos como Aplicarlos.

Índice

PreWork

Crear una instancia de Natural Language Understanding.

  1. En la plataforma de IBM Cloud dirígete a la sección de catálogo, y en la caja de búsqueda el nombre del servicio Natural Language Understanding y da click.
  2. Selecciona un nombre y da click en el botón de “crear” para obtener una instancia del servicio.
  3. En la barra que se encuentra a la izquiera navega a “gestionar” y copia el valor de la “clave de API” o “apikey” en un lugar ya que lo ocuparemos después.

Crear una instancia de Knowledge Studio.

  1. Igual que en la creación de la instancia del otro servicio, dirígete a la sección de catálogo y teclea el nombre del servicio “knowledge Studio”, da click, ponle un nombre y click al botón crear.
  2. Ahora dirígete a “gestionar” y click al botón que Inicia la herramienta de Knowledge Studio.

Crear el type system.

  1. Adentro de la herramienta crearemos un "workspace" de entidades y relaciones. Le damos click y le damos un nombre para el "workspace". Elegimos el idioma en el que estará la información de la cuál queremos extraer datos, que en este workshop serán en "español".
  2. Ahora crearemos el “type system” el cuál son el conjunto de las entidades que queremos extraer de los documentos que nos interesa sacarles datos.
    • Para fines prácticos de este workshop tenemos un “type system” en formato .json listo para cargarse en la herramienta. Este archivo .json se encuentra dentro del file que descargaste de nuestro repositorio en GitHub. (data/”types…”.json)
    • Haz click en “upload”.
    • Carga el archivo en formato .json.

      Y ya tienes creado el “type system” con las entidades que deseas extraer de información no estructurada.

Crear el corpus.

  1. Ahora crearemos el “corpus” que son los documentos que usaremos para entrenar nuestro modelo, en el cuál identificaremos manualmente las entidades de nuestro “type system”.
    • Para fines prácticos de éste workshop tenemos un “corpus” de documentos de ejemplo para nuestro entrenamiento y ya preparados para entrenarse con algoritmos de inteligencia artificial. El archivo se encuentra en (data/corpus…zip).
  2. Seleccionamos “upload documents sets”.
  3. Cargamos el documento.
  4. Se creó un “document set” el cuál tiene 10 archivos .txt que se usarán para el entrenamiento.
    El “document set” se dividió entre training, test, blind porque para motivos del workshop el “corpus” ya tiene precargado el “ground truth” ya que los documentos vienen pre anotados.

Crear annotation task

Para tener organizadas nuestras anotaciones debemos crear un “task”.

  1. Ve a la sección de “annotations”, pestaña “annotations tasks” y dale click a “add task”.
  2. Le damos un nombre y nos dirigimos a "Crear un se de anotaciones".
  3. Te saldrá que lo nombres, déjalo con los valores por default y elige un anotador que en este caso será tu usuario.
  4. Ya que has creado tu “task” con un set de anotaciones dentro, has click en tu task que acabas de crear.

Anotación del set de documentos

  1. Has click en “annotate”.
  2. Veras todos los documentos que formas el set de anotación.
    • Dale click a alguno.
  3. Notarás que ya vienen las anotaciones de las entidades echas en nuestros documentos, y esto es para fines prácticos del workshop. Debes saber que estas anotaciones se deben hacer por un humano en cada uno de los documentos que formen nuestro “corpus”.
  4. Regresa a la vista donde vemos todos los documentos.
  5. Selecciona “submit all documents” lo que quiere decir que las anotaciones ya están listas.
  6. Selecciona el set recién anotado y da click en "aceptar".

Entrenar el modelo

  1. Dirigete a la sección de “performance” y da click en “train and evaluate”.
  2. Selecciona el set y dale click a “train”.
  3. Envíaste tu “corpus” con las anotaciones a algoritmos de inteligencia artificial para obtener un modelo personalizado para entender lenguaje natural. El entrenamiento tarda aproximadamente 10 minutos.

Desplegar el modelo en Natural Language Understanding.

  1. Dirigete a la sección “versions”.
  2. Has click en “create version".
  3. Damos click en "Deploy".
  4. Elije el servicio Natural Language Understanding para desplegar el modelo que acabas de crear.
  5. Busca el servicio que creamos en pasos anteriores del workshop.
  6. Has desplegado tu modelo personalizado con Knowledge Studio al servicio de Natural Language Understanding. Ahora serás capaz de obtener la información que quieres de cualquier texto.
  7. Copia el “Model ID” en un lugar.

Implementar el modelo en una Java app

  1. Ahora te proporcionamos una app desarrollada en Java para que puedas probar tu modelo de una manera muy intuitiva y visual. Siéntete libre de explorar la app para que veas como funcionan las llamadas a la API de Natural Language Understanding.
  2. En la carpeta del proyecto dirígete a "src/main/resources/config.properties". Ahí debes poner las credenciales de los servicios que creaste en los primeros pasos.
    • nota: el username siempre será “apikey”.
  3. Ahora dirígete al archivo "manifest.yml" que es el archivo con el que se hará el despliegue a la nube. Ponle un nombre único en la sección de “name”.

Subir la app a la nube

  1. Abre la terminal y escribe lo siguiente para loguearte a IBM Cloud desde la terminal.
      ibmcloud login –sso
  1. Logueate en la region sur (si te lo solicita).
  2. Escribe lo siguiente comando para apuntar a una organización y un espacio.
      ibmcloud target –cf
  1. Apunta a un resource group con el siguiente comando.
    ibmcloud target -g Default
  1. Posicionate en la carpeta del proyecto y escribe lo siguiente para hacer el "build" de la app.
    mvn clean package
  1. Ahora con el siguiente comando haras el "deploy" a la nube.
    ibmcloud cf push
  1. Entra a la url que te arroja al final, y tendras desplegada la app y lista para usar.

knowledge-studio's People

Contributors

lex-villa avatar marcoalvarezg avatar

Stargazers

Luisca avatar

Watchers

James Cloos avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.