chat.py

#!/usr/bin/env python3
from math import log, pow
import sys
import time

import numpy as np
import tensorflow as tf

from utils.beam_search import BeamSearch
from utils.ranker import Ranker

stopwords = set(['嗎', '啊', '啦', '喇', '不', '是', '好', '吧', '你', '就'])

def load_model(model_dir):
    sess = tf.Session()
    meta_graph_def = tf.saved_model.loader.load(sess, [tf.saved_model.tag_constants.SERVING], model_dir)
    signature = meta_graph_def.signature_def

    q_name = signature['serving_default'].inputs['q'].name
    a_name = signature['serving_default'].inputs['a'].name

    output_name = signature['serving_default'].outputs['output'].name

    q = sess.graph.get_tensor_by_name(q_name)
    a = sess.graph.get_tensor_by_name(a_name)
    output = sess.graph.get_tensor_by_name(output_name)

    return sess, {'q': q, 'a': a, 'output': output}

def load_vocab():
    word_list = []
    word_idx_map = {}

    with open('data/vocab.txt', 'r') as f:
        for line in f:
            line = line.rstrip('\n')
            word_idx_map[line] = len(word_list)
            word_list.append(line)

    return word_list, word_idx_map

if __name__ == '__main__':

    idx2word, word2idx = load_vocab()
    sess, tensors = load_model(sys.argv[1])
    beam_search = BeamSearch(session=sess,
                             eval_tensors=tensors['output'],
                             feed_tensors=[tensors['q'], tensors['a']],
                             alpha=0.6,
                             beam_width=15,
                             max_length=32,
                             eos_id=1)
    ranker = Ranker(repeat_penality=1.5)

    while True:
        test_input = input('請輸入中文句子: ')

        test_input = [word2idx[el] for el in test_input if el in word2idx]
        while len(test_input) < 32:
            test_input.append(0)
        test_input = test_input[:32]

        start = time.time()
        finished_seq = beam_search.search(test_input)
        end = time.time()

        print('==============')
        print('Find {:d} candidates'.format(len(finished_seq)))
        print('Search time: %.6f sec' % (end - start))

        finished_seq.sort(key=lambda x: x['score'], reverse=True)
        responses =[]

        for seq in finished_seq:
            response = [idx2word[int(el)] for el in seq['ids']]
            while len(response) > 0 and (response[-1] == '<pad>' or response[-1] == '<eos>'):
                response.pop()

            response = ''.join(response)
            responses.append(response)

        rerank_scores = ranker.fit_transform(responses)

        for rescore, seq, response in zip(rerank_scores, finished_seq, responses):
            print('Score: {:.6f}, Re-rank score: {:>9.6f}, Response: {:s}'.format(seq['score'], rescore, response))

        final_id = rerank_scores.index(max(rerank_scores))

        print('==============')
        print('Finial response: {:s}'.format(responses[final_id]))
        print('==============')