Please use this identifier to cite or link to this item: https://hdl.handle.net/10216/107201
Author(s): João Carlos Gonçalves Costa
Title: Assistentes Virtuais para Comunicação Empresarial
Issue Date: 2017-07-14
Abstract: In recent years, the number of devices with Internet access as well as the efficiency of remote communications have increased. Despite the fact that today there are numerous communication channels such as chat, email and video, people still consider voice calls as the communication channel that offers a more personal experience in real time. However, in the business world, people are constantly busy with meetings and tasks, failing to respond immediately to all contacts they receive. On the other hand, more and more companies choose to outsource certain tasks as well as allow their employees to work remotely from their home. This made an increase in telephone audioconferences, telephone calls with more than just two participants. The audioconferences allow meetings between work teams located in different locations. Following the presented context, this dissertation was developed starting from two initial objectives. The first focused on the development of a system which, controlled exclusively by voice, would be able to manage several functionalities necessary to perform a telephone conference call, such as scheduling it or establishing its connection. The system takes advantage of a virtual assistant which communicates with the user in a way similar to a human. Together, and this was the second objective of this dissertation, a prototype of a system was developed to take advantage of an Android application for responding to all the native voice calls received by a busy user. A native call consists of a "regular" telephone call using the public switched telephone network (PSTN). The developed application detects a native voice call attempt and promptly starts a communication session with the person initiating the call through a virtual assistant (bot). The virtual assistant asks the user for the reason for the call and interactively offers some options to the person they tried to contact. It should be noted that at the end of this dissertation, both developed virtual assistants work independently. Nowadays there are tools and devices for speech recognition as well as tools for speech synthesis. The development of the virtual assistants took advantage of the mentioned tools, namely Amazon Lex and Amazon Alexa for understanding natural language and creating conversational flows, and the Google Cloud Speech API for converting audio to text. The Amazon Echo Dot device, a wireless speaker which allows the user to receive voice controls, was used to take advantage of Amazon's capabilities and enable voice communications with the user. The Twilio communication platform was also used, which allows, through an API, to receive, control and monitor telephone calls. The evaluation of the efficiency of the realized prototypes was achieved based on user satisfaction surveys and usability tests. With both developed systems, the questions that arose were able to be answered. However, the telephone conference management system has not been as effective and responsive to users as the system created to respond to calls received by a busy user.
Description: Nos últimos anos, o número de dispositivos com acesso à Internet aumentou, assim como a eficiência da comunicação remota. Não obstante o facto de existirem hoje inúmeros canais de comunicação, como chat, email, vídeo, as pessoas continuam a considerar as chamadas de voz como o canal de comunicação que oferece uma experiência mais pessoal em tempo real. Contudo, no mundo empresarial, as pessoas estão constantemente ocupadas com reuniões e tarefas, não conseguindo dar resposta imediata a todos os contactos que recebem. Por outro lado, cada vez mais empresas optam pela terceirização de certas tarefas, assim como permitem aos seus funcionários trabalharem remotamente a partir de sua casa. Isto levou a um aumento das audioconferências telefónicas, chamadas telefónicas com mais do que apenas dois participantes. Estas permitem a realização de reuniões entre equipas de trabalho localizadas em diferentes locais. No seguimento do contexto apresentado, esta dissertação foi desenvolvida partindo de dois objetivos iniciais. O primeiro centrou-se no desenvolvimento de um sistema que, controlado exclusivamente por voz, fosse capaz de gerir diversas funcionalidades necessárias à realização de uma audioconferência telefónica, como por exemplo, o agendamento ou a ligação à mesma. O sistema tira partido de um assistente virtual que comunica com o utilizador de forma semelhante à humana. Conjuntamente, e este foi o segundo objetivo desta dissertação, desenvolveu-se um protótipo de um sistema para, tirando partido de uma aplicação Android, responder a todas as chamadas de voz nativa recebidas por um utilizador que se encontra ocupado. Uma chamada nativa consiste numa chamada de telefone "regular" usando a public switched telephone network (PSTN). A aplicação desenvolvida deteta uma tentativa de chamada de voz nativa e inicia prontamente uma sessão de comunicação com a pessoa que iniciou a chamada, através de um assistente virtual (bot). O assistente virtual pergunta ao utilizador qual foi o motivo da chamada e interativamente oferece algumas opções à pessoa que tentou contactar. Refira-se que, à data de término desta dissertação, ambos os assistentes virtuais desenvolvidos funcionam de forma independente. Já existem hoje em dia ferramentas e dispositivos de reconhecimento de fala, assim como sistemas que fazem o processo inverso, sistemas texto-voz. Na elaboração dos assistentes virtuais tirou-se partido das ferramentas referidas, nomeadamente do Amazon Lex e Amazon Alexa para entendimento de linguagem natural e criação de fluxos conversacionais e do Google Cloud Speech API para conversão de áudio em texto. O dispositivo Amazon Echo Dot, uma coluna wireless que permite receber controlos por voz, foi usado para tirar partido das capacidades da Amazon Alexa e permitir uma comunicação por voz com o utilizador. Utilizou-se também a plataforma de comunicações Twilio, que permite, através de uma API, receber, controlar e monitorizar chamadas telefónicas. A avaliação da eficiência dos protótipos realizados foi conseguida com base em inquéritos de satisfação dos utilizadores e em testes de usabilidade. Com ambos sistemas desenvolvidos conseguiu-se dar resposta às questões que se levantaram. Contudo, o sistema de gestão de audioconferências telefónicas não apresentou uma eficácia e recetividade por parte dos utilizadores tão elevada como o sistema criado para dar resposta às chamadas recebidas por um utilizador que se encontra ocupado.
Subject: Engenharia electrotécnica, electrónica e informática
Electrical engineering, Electronic engineering, Information engineering
Scientific areas: Ciências da engenharia e tecnologias::Engenharia electrotécnica, electrónica e informática
Engineering and technology::Electrical engineering, Electronic engineering, Information engineering
TID identifier: 201798832
URI: https://hdl.handle.net/10216/107201
Document Type: Dissertação
Rights: openAccess
License: https://creativecommons.org/licenses/by-nc-sa/4.0/
Appears in Collections:FEUP - Dissertação

Files in This Item:
File Description SizeFormat 
211521.pdfAssistentes Virtuais para Comunicação Empresarial2.24 MBAdobe PDFThumbnail
View/Open


This item is licensed under a Creative Commons License Creative Commons