Các bước Lấy data của blogspot khác hay gọi lịch sự là lấy data, mà gọi không lịch sự là đi ăn cắp. Mình cũng từng bị một tên ăn chộm dự liệu bê y nguyên 2400 bài viết của mình về và upload lên host của tên vô lại đó. Các bạn có thể xem trang của tên vô lại đó TẠI ĐÂY
Mình viết bài này không khuyến khích các bạn làm thế vì mình từng là nạn nhân nên mình rất hiểu tâm trạng của người bị hại sẽ như thế nào. Đặc biệt là vấn đề bản quyền (nếu bị tố cáo vi phạm bản quyền google thì bạn sẽ bị delete ngay đó). Dưới đây là các thủ đoạn ăn chôm của những kẻ đi choom:
Bước 1: Xác định blog muốn lấy dữ liệu!
- Blogspot cần lấy phải thỏa mãn điều kiện rss của nó phải là rss full, rss không bật full thì chỉ lấy phần giới thiệu
- Để xác định rss là full hay không chỉ cần đánh tên địa chỉ web như sau vào :
http://diachi.blogspot.com/atom.xml
Thay: diachi thành tên blog cần lấy Ví dụ: http://namkna.blogspot.com/atom.xml (Tất nhiên sau sự cố mất cắp data mình đã fix lại rồi nên các bạn đừng thắc mắc tại sao chỉ có phần trích dẫn nha).
- Nếu rss được bật full thì ta có thể lấy toàn bộ data. còn không thì dừng ở đây được rồi. Có một số template yêu cầu bắt buộc phải bật full rss như template Simplex Celebrity .... các trang tin hot teen hay dùng lắm, và một số Blogger mới vào nghề chưa biết hay quyên.
Bước 2: Xác định tổng só bài viết của blog muốn lấy dữ liệu!
- Xác định tổng số bài viết có trong blogspot đó bằng cách tạo một bài viết mới và Pate co bên dưới vào phần html rồi xuất bản (Hoặc có thể test trực tiếp tại cuông cụ editor HTML của namkna)
<script style="text/javascript">
function showpostcount(json) {
document.write('<center>Tổng số bài: <b>' + parseInt(json.feed.openSearch$totalResults.$t,10)
+ '</b></center>');}</script>
<script src="http://namkna.blogspot.com/feeds/posts/default?alt=json-in-script&callback=showpostcount"></script>
<script style="text/javascript"></script>
Thay: namkna.blogspot.com bằng tên blog bạn cần khi đó sẽ hiển thị số bài đăng như sau:Tổng số bài: 3468
Cần xác định số bài đăng vì vì 1 số blogspot khủng data > 10000 bài nên sẽ chia nhỏ thành các đoạn data ,sau đó lấy theo khỏang từ 1-50 bài hay 1-10 bài tùy đường truyền mạng hay cấu hình máy. Blogspot cho import tối đa 500 bài.
Bước 3: Tiến hành chia nhở và tải dữ liệu về máy!
- Copy và paste đoạn cần lấy vào chương trình download IDM khi đó sẽ là nếu máy ai chưa cài IDm có thể download TẠI ĐÂY. Sau khi cài đặt bạn bấm vào Tasks => Add new download và sử dụng cú pháp bên dưới:
- Để tải về bạn sử dụng cú pháp sau:
- Ví dụ đoạn link dưới đây là lấy từ bài 1 đến bài 10 kể từ bài đăng mới nhất.
- Để tải về bạn sử dụng cú pháp sau:
http://diachi.blogspot.com/atom.xml?redirect=false&start-index=m&max-results=nTrong đó:
- start-index=m bắt đầu bài đăng mới nhất
- max-result=n lấy n bài, bắt đầu từ bài từ bài thứ m
- diachi.blogspot.com: là blog cần lấy Data
- Ví dụ đoạn link dưới đây là lấy từ bài 1 đến bài 10 kể từ bài đăng mới nhất.
http://diachi.blogspot.com/atom.xml?redirect=false&start-index=1&max-results=10Nếu muốn lấy thêm 10 bài thì bạn sử dụng tiếp mã như bên dưới:
http://diachi.blogspot.com/atom.xml?redirect=false&start-index=11&max-results=10
http://diachi.blogspot.com/atom.xml?redirect=false&start-index=21&max-results=10
..................................
- Sau đó ta thu được các file .xml (chuẩn rss hình như wordpress cũng cho phép import rss vào- chưa thử)
Bước 4: Nhập dữ liệu bài đăng (Import data) lên blog của bạn!
- Import file xml đó vào blogspot bằng cách vào Cài đặt => Khác => Nhập Blog
=> Chỉ đường dẫn tới các file .XML mà bạn vừa download về.-chú ý : khi import xong nên đăng lấy lệ 1 vài bài để xóa bỏ capchar khi import quá nhiều bài 1 lúc, google săm soi blog sẽ cho là spam sẽ disable acc.
Cập nhật: Cách cài đặt để bảo vệ dữ liệu trên blog của bạn!
- Tránh cho blog của bạn bằng cách tắt chức năng full này đi bằng cách vào Setting ( Cài đặt ) -> Khác => tại mục Cho phép nguồn cấp dữ liệu Blog bạn chọn Cho đến dấu ngắt .
Nếu template bắt buộc đặt full thì ta nên tạo thêm 1 đoạn giới thiệu ,để khi bài được mang vác khắp nơi người đọc biết nguồn xuất phát từ đâu khi có ai dùng bằng cách tại mục Chân trang nguồn cấp dữ liêu bạn chọn thêm và đánh nội dung vào như hình dưới.
Chúc các bạn ngăn chặn hiệu quả!