Lấy dữ liệu từ web đưa vào google sheet

Nhập dữ liệu từ bất kỳ loại dữ liệu nào có cấu trúc bao gồm XML, HTML, CSV, TSV và nguồn cấp dữ liệu RSS và ATOM XML.

Ví dụ mẫu

IMPORTXML("https://en.wikipedia.org/wiki/Moon_landing"; "//a/@href")

IMPORTXML(A2;B2)

Cú pháp

IMPORTXML(url; truy_vấn_xpath)

  • url – URL của trang cần kiểm tra, bao gồm giao thức (ví dụ: http://).

    • Giá trị của url phải được đặt trong dấu ngoặc kép hoặc tham chiếu đến ô có chứa văn bản phù hợp.
  • truy_vấn_xpath – Truy vấn XPath để chạy trên dữ liệu có cấu trúc.

    • Để biết thêm thông tin về XPath, hãy xem http://www.w3schools.com/xml/xpath_intro.asp.

Xem thêm

IMPORTRANGE: Nhập một dải ô từ một bảng tính được chỉ định.

IMPORTHTML: Nhập dữ liệu từ bảng hoặc danh sách trong trang HTML.

IMPORTFEED: Nhập nguồn cấp dữ liệu RSS hoặc ATOM.

IMPORTDATA: Nhập dữ liệu tại một url cho sẵn theo định dạng .csv (giá trị được phân cách bằng dấu phẩy) hoặc .tsv (giá trị được phân cách bằng tab).

Tìm hiểu cách tối ưu hoá tệp đối chiếu dữ liệu.

Thông tin này có hữu ích không?

Chúng tôi có thể cải thiện trang này bằng cách nào?

Nhập dữ liệu từ bảng hoặc danh sách trong trang HTML.

Ví dụ mẫu

IMPORTHTML("http://en.wikipedia.org/wiki/Demographics_of_India";"bảng";4)

IMPORTHTML(A2;B2;C2)

Cú pháp

IMPORTHTML(url; truy_vấn; chỉ_mục)

  • url – URL của trang cần kiểm tra, bao gồm giao thức (ví dụ: http://).

    • Giá trị của url phải được đặt trong dấu ngoặc kép hoặc tham chiếu đến ô chứa văn bản phù hợp.
  • truy_vấn – "danh_sách" hoặc "bảng" tùy thuộc vào loại cấu trúc chứa dữ liệu mong muốn.

  • chỉ_mục – Chỉ mục, bắt đầu tại 1, xác định bảng hoặc danh sách được xác định trong nguồn HTML sẽ được trả về.

    • Chỉ mục cho các danh sách và bảng được duy trì riêng, vì vậy, cả bảng và danh sách đều có thể có cùng chỉ mục 1 nếu cả hai loại yếu tố cùng tồn tại trên trang HTML.

Xem thêm

IMPORTXML: Nhập dữ liệu từ bất kỳ loại dữ liệu nào có cấu trúc bao gồm XML, HTML, CSV, TSV và nguồn cấp dữ liệu RSS và ATOM XML.

IMPORTRANGE: Nhập một dải ô từ một bảng tính được chỉ định.

IMPORTFEED: Nhập nguồn cấp dữ liệu RSS hoặc ATOM.

IMPORTDATA: Nhập dữ liệu tại một url cho sẵn theo định dạng .csv (giá trị được phân cách bằng dấu phẩy) hoặc .tsv (giá trị được phân cách bằng tab).

Tìm hiểu cách tối ưu hoá tệp đối chiếu dữ liệu.

Thông tin này có hữu ích không?

Chúng tôi có thể cải thiện trang này bằng cách nào?

Hàm importxml trong Google Sheet có thể giúp bạn cập nhật giá hàng trên Website theo thời gian thực

Giả sử, bạn có link tới 1 mặt hàng trên trang Web thương mại điện tử Aliexpress như sau:

Link sản phẩm

Lấy dữ liệu từ web đưa vào google sheet

Mục tiêu là lấy được con số 60.38 về Google Sheet của bạn 1 cách tự động, nếu có link sản phẩm

Cách làm như sau:

Bấm chuột phải vào giá sản phẩm, chọn “Inspect Element” nếu bạn đang dùng Google Chrome

Lấy dữ liệu từ web đưa vào google sheet

Như vậy các bạn sẽ nhìn thấy 1 hình tương tự như sau:

Lấy dữ liệu từ web đưa vào google sheet

Lưu ý tới dòng:

<span id="j-sku-discount-price" class="p-price" itemprop="price">60.38</span>

Sau đó các bạn bấm chuột phải vào dòng code này, chọn copy > copy XPath như hình sau

Lấy dữ liệu từ web đưa vào google sheet

Nội dung copy được trong trường hợp này sẽ là: //*[@id=”j-sku-discount-price”]

Để sử dụng được trong công thức ImportXML của Google Sheet, chúng ta cần thay dấu nháy kép bởi dấu nháy đơn: //*[@id=’j-sku-discount-price’]

Quay trở về file Google Sheet của mình chuẩn bị sẵn cho các bạn tại đây

Dán link sản phẩm vào ô A2, và copy công thức sau đây vào ô C2

=IMPORTXML(A2,“//*[@id=’j-sku-discount-price’]”)

Một cách tự động và kì diệu, các bạn sẽ lấy được giá sản phẩm với link sản phẩm 1 cách tự động với hàm IMPORTXML. Các bạn lặp lại thao tác này với các sản phẩm khác là đã có 1 bảng theo dõi giá cả sản phẩm theo thời gian thực ngay trong Google Sheet của bạn rồi.

Lấy dữ liệu từ web đưa vào google sheet

Kĩ thuật này không giới hạn ở việc lấy giá sản phẩm, nó có thể được áp dụng để lấy tên sản phẩm với đường link. Các bạn có thể thảo luận thêm và nói cho mình biết suy nghĩ của các bạn trong phần comment phía dưới bài nhé.

P.S: Ngoài cách sử dụng hàm ImportXML ra, các bạn có thể sử dụng các hàm được YQL hỗ trợ để có thể scrape HTML, crawl data từ các trang web khác với rất nhiều sự lựa chọn linh hoạt và hỗ trợ nhiều ngôn ngữ khác nhau, trong đó có cả VBA trong Excel

Với YQL, bạn có thể thử bấm vào link này để xem kết quả

Lấy dữ liệu từ web đưa vào google sheet

Tác giả: dtnguyen (Nguyễn Đức Thanh)

@ Học Excel Online | DTNguyen.business