Tìm kiếm mã nguồn, kho lưu trữ, người dùng, vấn đề, yêu cầu kéo…

spacy

Chào mừng bạn đến với spaCy, thư viện xử lý ngôn ngữ tự nhiên tiên tiến nhất dành cho Python và Cython. SpaCy được xây dựng dựa trên những nghiên cứu mới nhất và đã được thiết kế từ ngày đầu để sử dụng trong các sản phẩm thực tế.

Với spaCy, bạn có thể:

  • Sử dụng các pipeline được huấn luyện trước và hiện tại hỗ trợ cắt từ và huấn luyện cho hơn 70 ngôn ngữ.
  • Tận dụng tốc độ và mô hình mạng nơ-ron tiên tiến để gắn thẻ, phân tích cú pháp, nhận dạng thực thể có tên, phân loại văn bản và nhiều nhiệm vụ khác.
  • Học đa nhiệm với các transformers được huấn luyện trước như BERT và hệ thống huấn luyện sẵn sàng sử dụng, dễ dàng đóng gói mô hình, triển khai và quản lý quy trình làm việc.

Phiên bản 3.7 đã ra mắt!

Hãy kiểm tra thông tin chi tiết phiên bản mới nhất tại đây.

Tài liệu

  • spaCy 101 – Tài liệu dành cho người mới bắt đầu sử dụng spaCy.
  • Hướng dẫn sử dụng – Cách sử dụng spaCy và các tính năng của nó.
  • Tính năng mới trong v3.0 – Các tính năng mới, không tương thích ngược và hướng dẫn di chuyển.
  • Mẫu dự án – Quy trình làm việc từ đầu đến cuối mà bạn có thể sao chép, thay đổi và chạy.
  • Tham chiếu API – Tham khảo chi tiết về API của spaCy.
  • Xử lý GPU – Sử dụng spaCy với xử lý GPU tương thích CUDA.
  • Mô hình – Tải xuống các pipeline được huấn luyện cho spaCy.
  • Mô hình ngôn ngữ lớn – Tích hợp LLM vào các pipeline của spaCy.
  • Vũ trụ – Các plugin, phần mở rộng, bản demo và sách từ hệ sinh thái spaCy.
  • Tiện ích mở rộng spaCy cho VS Code – Công cụ và tính năng bổ sung cho việc làm việc với các tệp cấu hình spaCy.
  • Khóa học trực tuyến – Học spaCy trong khóa học trực tuyến miễn phí và tương tác này.
  • Blog – Đọc về phát triển spaCy và Prodigy hiện tại, các bản phát hành, các buổi nói chuyện và nhiều hơn nữa từ Explosion.
  • Video – Kênh YouTube của chúng tôi với các video hướng dẫn, buổi nói chuyện và nhiều hơn nữa.
  • Lịch sử thay đổi – Các thay đổi và lịch sử phiên bản.
  • Đóng góp – Làm thế nào để đóng góp vào dự án và mã nguồn spaCy.
  • Swag – Hỗ trợ cho chúng tôi và công việc của chúng tôi với các sản phẩm độc đáo và thiết kế tùy chỉnh!
READ  Biển số xe 62 - Từ đâu mà đến?

Đánh giá và bảo mật

SpaCy là một phần mềm mã nguồn mở thương mại, được phát hành theo giấy phép MIT. Để biết thêm thông tin chi tiết và bảo mật, vui lòng truy cập suaxemay24hsaigon.com.

Documentation

  • Các pipeline có sẵn – Mô tả chi tiết về pipeline, các con số chính xác và các bài đo đạc.
  • Tài liệu mô hình – Hướng dẫn sử dụng và cài đặt chi tiết.
  • Huấn luyện – Cách huấn luyện các pipeline của riêng bạn với dữ liệu của bạn.

Cài đặt spaCy

Để cài đặt spaCy, bạn có thể sử dụng pip hoặc conda. Trước khi cài đặt spaCy và các phụ thuộc của nó, hãy đảm bảo rằng phiên bản pip, setuptools và wheel của bạn đã được cập nhật.

Để cài đặt các bảng dữ liệu bổ sung cho lemmatization và normalization, bạn có thể chạy lệnh pip install spacy[lookups] hoặc cài đặt spacy-lookups-data một cách riêng lẻ.

Nếu bạn sử dụng pip, bạn nên cài đặt các gói trong một môi trường ảo để tránh sửa đổi trạng thái hệ thống:

pip install -U pip setuptools wheel
pip install -U spacy

Bạn cũng có thể cài đặt spaCy từ conda qua kênh conda-forge:

conda install -c conda-forge spacy

Điều này sẽ cài đặt phiên bản mới nhất của spaCy và các phụ thuộc của nó.

Các hệ điều hành và phiên bản Python được hỗ trợ

  • Hệ điều hành: macOS / OS X, Linux, Windows (Cygwin, MinGW, Visual Studio)
  • Phiên bản Python: Python 3.7+ (64 bit)
READ  TOP 10 Tiệm Sửa Xe Yamaha Uy Tín, Chất Lượng, Phục Vụ Chu Đáo

Cài đặt mô hình

Các pipeline được huấn luyện cho spaCy có thể được cài đặt dưới dạng gói Python. Điều này có nghĩa rằng chúng là một phần của ứng dụng của bạn, giống như bất kỳ module nào khác. Bạn có thể cài đặt các mô hình bằng cách sử dụng lệnh tải xuống của spaCy hoặc bằng cách chỉ định pip đến một đường dẫn hoặc URL.

Để tải một mô hình, hãy sử dụng spacy.load() với tên mô hình hoặc đường dẫn đến thư mục dữ liệu mô hình.

import spacy

nlp = spacy.load("en_core_web_sm")

Đây là ví dụ về cách tải mô hình “en_core_web_sm” cho ngôn ngữ tiếng Anh.

Cài đặt spaCy từ mã nguồn

Cách cài đặt spaCy từ mã nguồn là sao chép kho lưu trữ GitHub và xây dựng nó từ mã nguồn. Điều này thường được sử dụng khi bạn muốn thay đổi mã nguồn. Bạn cần đảm bảo rằng môi trường phát triển của bạn bao gồm một bản phân phối Python bao gồm các tệp tiêu đề, một trình biên dịch, pip, virtualenv và git được cài đặt. Cách làm điều này phụ thuộc vào hệ thống của bạn.

Để cài spaCy từ mã nguồn, bạn có thể làm như sau:

Ubuntu

Cài đặt các phụ thuộc cấp hệ thống thông qua apt-get:

sudo apt-get install build-essential python-dev git

Mac

Cài đặt phiên bản mới nhất của XCode, bao gồm “Command Line Tools”.

Windows

Cài đặt phiên bản Visual C++ Build Tools hoặc Visual Studio Express phù hợp với phiên bản đã được sử dụng để biên dịch trình thông dịch Python của bạn.

READ  Honda SH125 2024: Sự Hứa Hẹn Của Dòng Xe Mới Nhất Đến Ngày Hôm Nay

Để biết thêm chi tiết và hướng dẫn, vui lòng truy cập tài liệu spaCy về việc biên dịch từ nguồn.

Chạy kiểm tra

SpaCy đi kèm với một bộ kiểm tra mở rộng. Để chạy các kiểm tra, bạn thường muốn sao chép kho lưu trữ và xây dựng spaCy từ nguồn. Điều này cũng sẽ cài đặt các phụ thuộc phát triển cần thiết và các tiện ích kiểm tra được xác định trong tệp requirements.txt.

Một cách khác, bạn có thể chạy pytest trên các bài kiểm tra từ gói spaCy đã cài đặt. Đừng quên cài đặt các tiện ích kiểm tra thông qua requirements.txt của spaCy:

pip install -r spacy/requirements.txt
pytest spacy

Trên đây là những điểm cần được chú ý khi sử dụng spaCy. Đối với thông tin chi tiết hơn, vui lòng tham khảo tài liệu.