Thứ Hai, 20 tháng 4, 2015

Bài tập lớn CTDLGT cho lớp VUW-IT

Bài 1. (Phát triển từ bài tìm danh từ riêng) Tìm xem danh từ riêng nào được đề cập đến nhiều nhất trong một tập văn bản ( khoảng 50-100 văn bản).

  • Các danh từ riêng bao gồm cả danh từ nối và không được nối.

Từ đó đưa ra xem danh từ nào đang là hot trend. (các danh từ được đề cập đến nhiều nhất trong nhiều văn bản)

  • Chú ý việc các danh từ viết tắt (cùng xuất hiện trong văn bản)

Tập văn bản (50-100) văn bản do sinh viên lấy từ các nguồn như BBC.com hoặc CNNNews.com hoặc VOANews.com

Có thể sử dụng chung tập dữ liệu nếu cùng làm một bài (Miễn là không dùng chung code :D )

Bài 2. Tìm tập danh từ riêng theo chủ đề

Đầu vào là một tập văn bản tiếng Anh thuộc nhiều chủ đề (>=3 chủ đề), mỗi chủ đề khoảng (10-20 văn bản). Các chủ đề như
  • Thể thao
  • Chính trị
  • Khoa học công nghệ
  • Kinh doanh
Với mỗi một chủ đề ta tìm các danh từ riêng và đưa ra tập danh từ riêng đăc jtrung cho từng chủ đề dựa trên tần số xuất hiện.

Danh từ riêng nào xuất hiện đồng thời trong nhiều chủ đề khác nhau ?
Danh từ đó có đặc điểm gì ?


Thứ Tư, 15 tháng 4, 2015

Tuyển thực tập làm về Big Data

Yêu cầu

  • Sử dụng thành thạo Java (Core Java)
  • Có kiến thức tốt về cấu trúc dữ liệu và thuật toán
  • Có khả năng tự học, tự nghiên cứu

Quyền lợi
  • Môi trường làm việc tốt
  • Có chế đỗ đãi ngộ tùy theo năng lực
  • Thời gian làm việc linh động tùy theo thời gian học (nửa buổi sáng hoặc chiều nếu phải học trên trường)
  • Được đào tạo cơ bản về các công nghệ tiên tiến nhất về Big Data và phân tích dữ liệu lớn
  • Được nhận vào làm chính thức nếu làm tốt
  • Được tham gia vào các dự án về Big Data (hệ thống recommendation, finger printing, big data analysis, real time ads-scheduler,..)
Liên hệ.
  • Comment vào cuối bài viết này hoặc PM nguyenduyhiep@gmail.com

Bài đăng phổ biến