Skip to main content

Chuyển data từ Amazon S3 về server

Using Amazon S3 data in PHP - Switch from S3 to server VPS

Bài này note lại một số lưu ý khi chuyển data từ S3 về server hay local, dừng dịch vụ S3.
Các bước dừng dịch vụ S3:
1. Download dữ liệu từ S3 về.
2. Sửa mã để dùng data trên server (hay cloud khác) thay vì S3. Cập nhật Database.
3. Hoàn tất: testing và các vđ liên quan.

1. Download: dùng awscli (trên ubuntu, osx cài dùng pip ), web interface hay wget, CURL ...
- Extract s3 url dùng mysql
mysql -e "select picture from post where picture like 'https://s3%'" -u username -p db_name > s3_post_list.txt
Dùng PHP nếu lệnh query phức tạp và đòi hỏi tính toán nhiều hơn. Như ở trên thì chỉ cần tìm record có trường picture có chữ https://s3-*** vì logic ở đây lưu cả URL S3. Nếu chỉ lưu tên object (như tên file, ảnh) trên S3 thì cần logic khác.
Việc lọc bớt ảnh chỉ của S3 vì có thể ảnh là embed (link từ gippy hay 1 cloud nào đó) để tránh lấy nhầm ảnh ko phải từ S3.
Sau khi có list ảnh thì download, vd dùng wget:

wget -i post_list.txt

Lệnh này tài hết file trong list, các link file ở các dòng.

2. Sửa code
Tùy theo logic trang web mà sửa. Sẽ hơi vất chút khi bạn chỉ maintain mà ko code từ đầu.
Lưu ý:
- Link ảnh, file trên server (dùng server lưu data) cần để ý https://host_name ...
- S3 ko có khái niệm folder, tất cả là object, nếu lúc đầu không phân folder trên S3. Bây h lưu data trên server mới phân folder thì cũng phải code lại logic.
Path file trong Database SQL sẽ cần lưu ý vd trước kia trên S3 là abcdeuteuhsou.png
bây h là 2016/01/01/abceuteuhsou.png ... nên nhiều logic liên quan như view, controller cần cập nhật.
- Số lượng, kích thước data lớn quá sẽ cần các thao tác khác bọt để port dữ liệu. Wget download file số lượng lớn tốt nhất chạy trên VPS vì thường tốc độ đường truyền trên VPS tốt hơn nhiều. Vd Digital Ocean download 1GB mất tầm 40s (tính cả tg linh tinh + vào), speed trung bình là 40MB/s.
Mạng cáp quang ở các cty cỡ vừa cũng thường được vài MB/s. Nhưng so với Server thì thua xa.
Sau khi tải file S3 về server thì có thể dùng rsync trên linux để backup dữ liệu.
rsync --ignore-existing --recursive /src /dst

digit ocean rsync
3. Hoàn tất
Test lại cẩn thận các thao tác.


Comments

Popular posts from this blog

AWS Elasticache Memcached connection

https://docs.aws.amazon.com/AmazonElastiCache/latest/mem-ug/accessing-elasticache.html#access-from-outside-aws http://hourlyapps.blogspot.com/2010/06/examples-of-memcached-commands.html Access memcached https://docs.aws.amazon.com/AmazonElastiCache/latest/mem-ug/GettingStarted.AuthorizeAccess.html Zip include hidden file https://stackoverflow.com/questions/12493206/zip-including-hidden-files phpmemcachedadmin ~ phpMyAdmin or phpPgAdmin ... telnet mycachecluster.eaogs8.0001.usw2.cache.amazonaws.com 11211 stats items stats cachedump 27 100 https://docs.aws.amazon.com/AmazonElastiCache/latest/mem-ug/VPCs.EC.html https://lzone.de/cheat-sheet/memcached VPC ID Security Group ID (sg-...) Cluster: The identifier for the cluster memcached1 Creation Time: The time (UTC) when the cluster was created January 9, 2019 at 11:47:16 AM UTC+7 Configuration Endpoint: The configuration endpoint of the cluster memcached1.ahgofe.cfg.usw1.cache.amazonaws.com:11211 St...

Notes Windows 10 Virtualbox config, PHP Storm Japanese, custom PHP, Apache build, Postgresql

 cmd => Ctrl + Shift + Enter mklink "C:\Users\HauNT\Videos\host3" "C:\Windows\System32\drivers\etc\hosts" https://www.quora.com/How-to-create-a-router-in-php https://serverfault.com/questions/225155/virtualbox-how-to-set-up-networking-so-both-host-and-guest-can-access-internet 1 NAT + 1 host only config https://unix.stackexchange.com/questions/115464/how-to-properly-set-up-2-network-interfaces-in-centos-running-in-virtualbox DEVICE=eth0 TYPE=Ethernet #BOOTPROTO=dhcp BOOTPROTO=none #IPADDR=10.9.11.246 #PREFIX=24 #GATEWAY=10.9.11.1 #IPV4_FAILURE_FATAL=yes #HWADDR=08:00:27:CC:AC:AC ONBOOT=yes NAME="System eth0" [root@localhost www]# cat /etc/sysconfig/network-scripts/ifcfg-eth1 # Advanced Micro Devices, Inc. [AMD] 79c970 [PCnet32 LANCE] DEVICE=eth1 IPADDR=192.168.56.28 <= no eff => auto like DHCP #GATEWAY=192.168.56.1 #BOOTPROTO=dhcp BOOTPROTO=static <= no eff ONBOOT=yes HWADDR=08:00:27:b4:20:10 [root@localhost www]# ...

Rocket.Chat DB schema

_raix_push_notifications avatars.chunks avatars.files instances meteor_accounts_loginServiceConfiguration meteor_oauth_pendingCredentials meteor_oauth_pendingRequestTokens migrations rocketchat__trash rocketchat_cron_history rocketchat_custom_emoji rocketchat_custom_sounds rocketchat_import rocketchat_integration_history rocketchat_integrations rocketchat_livechat_custom_field rocketchat_livechat_department rocketchat_livechat_department_agents rocketchat_livechat_external_message rocketchat_livechat_inquiry rocketchat_livechat_office_hour rocketchat_livechat_page_visited rocketchat_livechat_trigger rocketchat_message rocketchat_oauth_apps rocketchat_oembed_cache rocketchat_permissions rocketchat_raw_imports rocketchat_reports rocketchat_roles rocketchat_room rocketchat_settings rocketchat_smarsh_history rocketchat_statistics rocketchat_subscription rocketchat_uploads system.indexes users usersSessions https://rocket.chat/docs/developer-guides/sc...