You are on page 1of 15

Amazon S3

1. Amazon S3 là gì ?

Dịch vụ lưu trữ đơn giản của Amazon là lưu trữ cho Internet. Nó được thiết kế để làm cho
tính toán quy mô web dễ dàng hơn cho các nhà phát triển.

Amazon S3 có giao diện dịch vụ web đơn giản mà bạn có thể sử dụng để lưu trữ và truy
xuất bất kỳ lượng dữ liệu nào, bất cứ lúc nào, từ bất kỳ đâu trên web. Nó cho phép bất kỳ
nhà phát triển nào truy cập vào cùng một cơ sở hạ tầng lưu trữ dữ liệu có khả năng mở rộng
cao, đáng tin cậy, nhanh chóng, rẻ tiền mà Amazon sử dụng để điều hành mạng lưới các
trang web toàn cầu của riêng mình. Dịch vụ này nhằm mục đích tối đa hóa lợi ích của quy
mô và chuyển những lợi ích đó cho các nhà phát triển.

2. Tính năng của Amazon S3

Amazon S3 có nhiều tính năng mà bạn có thể sử dụng để tổ chức và quản lý dữ liệu nhằm hỗ
trợ các trường hợp sử dụng cụ thể, đạt hiệu quả về chi phí, thực thi bảo mật và đáp ứng các
yêu cầu về tuân thủ. Dữ liệu được lưu trữ dưới dạng đối tượng trong tài nguyên gọi là “bộ
chứa” và một đối tượng có thể có kích thước tối đa là 5 terabyte. Các tính năng của S3 bao
gồm khả năng bổ sung thẻ siêu dữ liệu cho đối tượng, di chuyển và lưu trữ dữ liệu trên Các
lớp lưu trữ S3, cấu hình và thực thi kiểm soát truy cập dữ liệu, ngăn không cho người dùng
trái phép truy cập dữ liệu, chạy phân tích dữ liệu lớn và giám sát dữ liệu ở cấp độ đối tượng
và bộ chứa.

 Quản lý và giám sát lưu trữ


Cấu trúc phẳng không theo cấp bậc và nhiều tính năng quản lý khác nhau của Amazon S3
đang hỗ trợ khách hàng thuộc mọi quy mô và lĩnh vực tổ chức dữ liệu theo những cách thức
có giá trị đối với doanh nghiệp và đội ngũ của họ. Tất cả đối tượng được lưu trữ trong bộ
chứa S3 và có thể được tổ chức với tên chung gọi là tiền tố. Bạn có thể bổ sung tối đa 10 cặp
khóa-giá trị gọi là thẻ đối tượng S3 cho mỗi đối tượng, có thể tạo, cập nhật và xóa các cặp
này trong toàn bộ vòng đời của một đối tượng. Để theo dõi các đối tượng và thẻ tương ứng
của chúng, bộ chứa và tiền tố, bạn có thể sử dụng báo cáo Kho S3 liệt kê các đối tượng được
lưu trữ của bạn trong một bộ chứa S3 hoặc với một tiền tố cụ thể, cùng với siêu dữ liệu và
trạng thái mã hóa tương ứng của chúng. Có thể cấu hình Kho S3 để tạo báo cáo hàng ngày
hoặc hàng tuần
*Quản lý lưu trữ

Với tên bộ chứa S3, tiền tố, thẻ đối tượng và Kho S3, bạn có nhiều cách để phân loại và báo
cáo về dữ liệu của mình, từ đó có thể cấu hình các tính năng S3 khác để thực hiện tác vụ. S3
Batch Operations giúp bạn dễ dàng quản lý dữ liệu trong Amazon S3 ở mọi quy mô, cho dù
bạn lưu trữ hàng nghìn hay một tỷ đối tượng. Với S3 Batch Operations, bạn có thể sao chép
đối tượng giữa các bộ chứa, thay thế tập thẻ, sửa đổi kiểm soát truy cập và khôi phục đối
tượng được lưu trữ từ Amazon S3 Glacier, với một yêu cầu API S3 hoặc vài cú nhấp chuột
trong Bảng điều khiển quản lý Amazon S3. Bạn cũng có thể sử dụng S3 Batch Operations để
chạy hàm AWS Lambda trên các đối tượng của mình để thực thi logic kinh doanh tùy chỉnh,
chẳng hạn như xử lý dữ liệu hoặc chuyển mã tệp hình ảnh. Để bắt đầu, hãy chỉ định một danh
sách đối tượng mục tiêu bằng cách sử dụng báo cáo Kho S3 hoặc cung cấp danh sách tùy
chỉnh, sau đó chọn thao tác mong muốn từ menu điền sẵn.

Amazon S3 cũng hỗ trợ các tính năng giúp duy trì kiểm soát phiên bản dữ liệu, ngăn việc xóa
ngẫu nhiên và sao chép dữ liệu trong các Khu vực AWS khác. Với S3 Versioning, bạn có thể
dễ dàng duy trì, truy xuất và khôi phục mọi phiên bản của một đối tượng được lưu trữ trong
Amazon S3, điều này cho phép bạn khôi phục từ các hoạt động vô tình của người dùng và sự
cố ứng dụng. Để ngăn việc xóa vô tình, hãy bật Xóa bằng Multi-Factor Authentication
(MFA) trên một bộ chứa S3. Nếu bạn tìm cách xóa một đối tượng được lưu trữ trong bộ chứa
hỗ trợ Xóa bằng MFA, việc này yêu cầu hai hình thức xác thực: thông tin đăng nhập tài
khoản AWS của bạn và chuỗi chữ số sê-ri hợp lệ, khoảng trắng và mã 6 chữ số hiển thị trên
thiết bị xác thực được phê duyệt, chẳng hạn như chuỗi khóa phần cứng hoặc khóa bảo mật
Universal 2nd Factor (U2F). Với Sao chép liên khu vực S3 (CRR), bạn có thể sao chép đối
tượng (cùng với siêu dữ liệu và thẻ đối tượng tương ứng của đối tượng) vào Khu vực AWS
khác để giảm độ trễ, đảm bảo tính tuân thủ, bảo mật, khôi phục sau thảm họa và phục vụ các
trường hợp sử dụng khác. CRR S3 được cấu hình cho một bộ chứa S3 nguồn và sao chép đối
tượng vào một bộ chứa đích trong Khu vực AWS khác.
*Giám sát lưu trữ :
Bạn có thể áp dụng thẻ cho bộ chứa S3 để phân bổ chi phí ở nhiều mảng kinh doanh (chẳng
hạn như trung tâm chi phí, tên ứng dụng hoặc chủ sở hữu), sau đó sử dụng Báo cáo phân bổ
chi phí AWS để xem mức sử dụng và chi phí do các thẻ bộ chứa tổng hợp. Bạn cũng có thể
sử dụng Amazon CloudWatch để theo dõi tình trạng vận hành của các tài nguyên AWS và
cấu hình thông báo thanh toán được gửi cho bạn khi khoản phí ước tính đạt đến một ngưỡng
do người dùng xác định. Một dịch vụ giám sát AWS khác là AWS CloudTrail, theo dõi và
báo cáo các hoạt động ở cấp độ bộ chứa và đối tượng. Bạn có thể kích hoạt S3 Event
Notifications để kích hoạt quy trình công việc, thông báo và gọi AWS Lambda khi một thay
đổi cụ thể được thực hiện đối với tài nguyên S3 của bạn. Thông báo sự kiện S3 có thể được
sử dụng để tự động chuyển mã tệp phương tiện khi các tệp này được tải lên Amazon S3, xử
lý tệp phương tiện khi khả dụng hoặc đồng bộ hóa đối tượng với các kho dữ liệu khác.

 Lớp lưu trữ


Với Amazon S3, bạn có thể lưu trữ dữ liệu qua một loạt các lớp S3 lưu trữ khác nhau:

 S3 Standard ( S3 Tiêu chuẩn)

S3 Standard cung cấp độ bền cao, tính sẵn có và lưu trữ đối tượng hiệu suất cho dữ liệu
thường xuyên truy cập.

Độ trễ thấp và hiệu suất thông lượng cao


Khả năng phục hồi chống lại các sự kiện ảnh hưởng đến toàn bộ Vùng sẵn có
Hỗ trợ SSL cho dữ liệu truyền và mã hóa dữ liệu khi nghỉ ngơi
Quản lý vòng đời S3 để tự động di chuyển các đối tượng sang các lớp lưu trữ S3
khác
Giá cả :

 S3 Intelligent-Tiering ( S3 Thông minh- sắp xếp theo lớp )


Lớp lưu trữ thông minh S3 được thiết kế để tối ưu hóa chi phí bằng cách tự động di
chuyển dữ liệu đến tầng truy cập hiệu quả nhất về chi phí, mà không ảnh hưởng đến hiệu
suất hoặc chi phí hoạt động. Nó hoạt động bằng cách lưu trữ các đối tượng trong hai tầng
truy cập: một tầng được tối ưu hóa để truy cập thường xuyên và một tầng khác có chi phí
thấp hơn được tối ưu hóa cho truy cập không thường xuyên. Đối với một khoản phí giám
sát và tự động hóa hàng tháng nhỏ cho mỗi đối tượng, Amazon S3 giám sát các mẫu truy
cập của các đối tượng trong S3 Thông minh-Tiering và di chuyển những thứ không được
truy cập trong 30 ngày liên tiếp đến tầng truy cập không thường xuyên. Nếu một đối
tượng trong tầng truy cập không thường xuyên được truy cập, nó sẽ tự động được chuyển
trở lại tầng truy cập thường xuyên. Không có phí truy xuất khi sử dụng lớp lưu trữ Thông
minh S3 và không có phí phân tầng bổ sung khi các đối tượng được di chuyển giữa các
tầng truy cập. Đây là lớp lưu trữ lý tưởng cho dữ liệu tồn tại lâu với các mẫu truy cập
không xác định hoặc không thể đoán trước .

Độ trễ thấp và hiệu suất thông lượng cao tương tự của Tiêu chuẩn S3
Phí giám sát và tự động hàng tháng nhỏ
Tự động di chuyển các đối tượng giữa hai tầng truy cập dựa trên việc thay đổi mẫu truy cập
Hỗ trợ SSL cho dữ liệu truyền và mã hóa dữ liệu khi nghỉ ngơi
Giá cả :

 S3 Standard-Infrequent Access (S3 Standard-IA) (Dùng cho tiêu chuẩn không


thường xuyên truy cập)
S3 Standard-IA dành cho dữ liệu được truy cập ít thường xuyên hơn, nhưng yêu cầu
truy cập nhanh khi cần. S3 Standard-IA cung cấp độ bền cao, thông lượng cao và độ
trễ thấp của Tiêu chuẩn S3, với giá lưu trữ trên mỗi GB thấp và phí truy xuất trên mỗi
GB. Sự kết hợp giữa chi phí thấp và hiệu suất cao này khiến S3 Standard-IA trở nên
lý tưởng cho việc lưu trữ lâu dài, sao lưu và làm kho lưu trữ dữ liệu cho các tệp khôi
phục thảm họa.
Giá cả :
 S3 One Zone-Infrequent Access (S3 One Zone-IA)(Dùng cho một vùng không
thường xuyên truy cập)

S3 One Zone-IA dành cho dữ liệu được truy cập ít thường xuyên hơn, nhưng yêu cầu
truy cập nhanh khi cần. Không giống như các lớp lưu trữ S3 khác lưu trữ dữ liệu
trong tối thiểu ba vùng khả dụng (AZ), S3 One Zone-IA lưu trữ dữ liệu trong một AZ
duy nhất và có giá thấp hơn 20% so với S3 Standard-IA. S3 One Zone-IA lý tưởng
cho những khách hàng muốn có tùy chọn chi phí thấp hơn cho dữ liệu được truy cập
không thường xuyên nhưng không yêu cầu tính khả dụng và khả năng phục hồi của
S3 Standard hoặc S3 Standard-IA. Đó là một lựa chọn tốt để lưu trữ các bản sao dự
phòng thứ cấp của dữ liệu tại chỗ hoặc dữ liệu dễ dàng tạo lại. Bạn cũng có thể sử
dụng nó làm bộ lưu trữ hiệu quả chi phí cho dữ liệu được sao chép từ một Vùng AWS
khác bằng cách sử dụng Sao chép vùng chéo S3.

Vì S3 One Zone-IA lưu trữ dữ liệu trong Vùng khả dụng AWS duy nhất, dữ liệu được
lưu trữ trong lớp lưu trữ này sẽ bị mất trong trường hợp phá hủy Vùng sẵn có.

Giá cả :

 Amazon S3 Glacier (S3 Glacier)

S3 Glacier là lớp lưu trữ an toàn, bền và chi phí thấp để lưu trữ dữ liệu. Bạn có thể
lưu trữ đáng tin cậy bất kỳ lượng dữ liệu nào với chi phí cạnh tranh hoặc rẻ hơn so
với các giải pháp tại chỗ. Để giữ chi phí thấp nhưng phù hợp với các nhu cầu khác
nhau, S3 Glacier cung cấp ba tùy chọn truy xuất trong khoảng từ vài phút đến vài
giờ.

Thời gian truy xuất cấu hình, từ vài phút đến vài giờ

API PUT S3 để tải trực tiếp lên S3 Glacier và quản lý Vòng đời S3 để tự động
di chuyển các đối tượng

Thiết kế giá rẻ là lý tưởng cho việc lưu trữ lâu dài


Giá cả :

 Amazon S3 Glacier Deep Archive (S3 Glacier Deep Archive).


Mỗi Lớp lưu trữ S3 đều hỗ trợ một cấp độ truy cập dữ liệu cụ thể với chi phí tương ứng. Điều
này có nghĩa là bạn có thể lưu trữ dữ liệu sản xuất tối quan trọng trong S3 Tiêu chuẩn cho
truy cập thường xuyên, tiết kiệm chi phí bằng cách lưu trữ dữ liệu truy cập không thường
xuyên trong S3 Standar– IA hoặc S3 One Zone – IA và lưu trữ dữ liệu với chi phí thấp nhất
trong các lớp lưu trữ – S3 Glacier và S3 Glacier Deep Archive.

Giá cả :

*Biểu đồ hiệu suất các dịch vụ của S3

 Quản lý truy cập và bảo mật

*Quản lý truy cập :

Để bảo vệ dữ liệu của bạn trong Amazon S3, theo mặc định, người dùng chỉ có quyền truy cập vào tài
nguyên S3 mà họ tạo. Bạn có thể cấp quyền truy cập cho người dùng khác bằng cách sử dụng một hoặc kết
hợp các tính năng quản lý truy cập sau: AWS Identity and Access Management (IAM) để tạo người dùng
và quản lý quyền truy cập tương ứng của họ; Access Control Lists (ACL) để làm cho các đối tượng riêng
lẻ có thể truy cập được đối với người dùng được ủy quyền; chính sách xô để định cấu hình quyền cho tất
cả các đối tượng trong một nhóm S3; và Query String Authentication để cấp quyền truy cập giới hạn thời
gian cho người khác bằng các URL tạm thời. Amazon S3 cũng hỗ trợ Audit Logs(Nhật ký kiểm toán) liệt
kê các yêu cầu được thực hiện đối với tài nguyên S3 của bạn để hiển thị đầy đủ về người đang truy cập dữ
liệu nào.

 Truy vấn tại chỗ

Amazon S3 có tính năng tích hợp và các dịch vụ miễn phí truy vấn dữ liệu mà không cần sao
chép và tải nó vào một nền tảng phân tích hoặc kho dữ liệu riêng biệt. Điều này có nghĩa là
bạn có thể chạy các phân tích dữ liệu lớn trực tiếp trên dữ liệu của bạn được lưu trữ trong
Amazon S3. S3 Chọn là một tính năng S3 được thiết kế để tăng hiệu suất truy vấn lên tới
400% và giảm chi phí truy vấn tới 80%. Nó hoạt động bằng cách truy xuất một tập hợp con
dữ liệu của một đối tượng (sử dụng các biểu thức SQL đơn giản) thay vì toàn bộ đối tượng,
có thể có kích thước lên tới 5 terabyte.

Amazon S3 cũng tương thích với các dịch vụ phân tích AWS Amazon Athena và Amazon
Redshift Spectrum. Amazon Athena truy vấn dữ liệu của bạn trong Amazon S3 mà không
cần phải trích xuất và tải nó vào một dịch vụ hoặc nền tảng riêng biệt. Nó sử dụng các biểu
thức SQL tiêu chuẩn để phân tích dữ liệu của bạn, cung cấp kết quả trong vài giây và thường
được sử dụng để khám phá dữ liệu ad hoc. Amazon Redshift Spectrum cũng chạy các truy
vấn SQL trực tiếp đối với dữ liệu ở phần còn lại trong Amazon S3 và phù hợp hơn cho các
truy vấn phức tạp và các tập dữ liệu lớn (tối đa exabyte). Vì Amazon Athena và Amazon
Redshift chia sẻ một danh mục dữ liệu và định dạng dữ liệu chung, bạn có thể sử dụng cả hai
cùng một bộ dữ liệu trong Amazon S3.

 Truyền dữ liệu
AWS có một bộ dịch vụ di chuyển dữ liệu giúp việc truyền dữ liệu vào AWS Cloud trở nên đơn giản,
nhanh chóng và an toàn. Tăng tốc truyền S3 được thiết kế để tối đa hóa tốc độ truyền tới các thùng S3
trong khoảng cách xa. Để truyền dữ liệu rất lớn, hãy cân nhắc sử dụng AWS Snowball , AWS Snowball
Edge và AWS Snowmobile để di chuyển petabyte đến exabyte dữ liệu lên AWS Cloud với chi phí chỉ
bằng 1/5 so với Internet tốc độ cao. Các dịch vụ AWS Snow này hoạt động bằng cách sử dụng các thiết bị
vật lý an toàn để vận chuyển dữ liệu qua đường và giải quyết các vấn đề di chuyển như chi phí mạng cao,
thời gian chuyển dài và bảo mật.

Khách hàng muốn giữ các ứng dụng tại chỗ của mình và kích hoạt kiến trúc lưu trữ đám mây có thể sử
dụng AWS Storage Gateway (dịch vụ lưu trữ đám mây lai) để kết nối liền mạch các môi trường tại chỗ với
Amazon S3. Bạn có thể tự động chuyển dữ liệu giữa lưu trữ tại chỗ và AWS (bao gồm cả Amazon S3)
bằng cách sử dụng AWS DataSync , có thể truyền dữ liệu với tốc độ nhanh hơn tới 10 lần so với các công
cụ nguồn mở. Nếu bạn muốn chuyển tệp trực tiếp vào và ra khỏi Amazon S3 bằng Giao thức truyền tệp an
toàn (SFTP), hãy sử dụng AWS Transfer cho SFTP - dịch vụ được quản lý hoàn toàn cho phép trao đổi
tệp an toàn với bên thứ ba.
Khách hàng cũng có thể làm việc với các nhà cung cấp bên thứ ba từ Mạng đối tác AWS (APN) để triển
khai các kiến trúc lưu trữ lai, tích hợp Amazon S3 vào các ứng dụng và quy trình công việc hiện có và
chuyển dữ liệu đến và từ AWS Cloud.

Cách tạo 1 bucket đơn giản S3 standar

Step1 :

Trước tiên chúng ta đến với bảng điều khiển của AWS Managerment. Click chọn dịch vụ
S3 trong tab Services .

Step 2:

Tiếp theo ta bước đến giao diện của dịch vụ AWS S3 và chọn tạo Bucket ( Tạo xô )
Step 3:

Cấu hình Bucket của bạn theo 3 giai đoạn và ấn tiếp tục

Chú thích :

1 . Bucket name(tên xô) : Tên bucket mà bạn muốn tạo, viết liền không dấu, hoặc ngăn cách bởi
dấu gạch ngang “-” giữa các từ (ví dụ hocmangmaytinh hoặc hoc-mang-may-tinh)
2. Region(Khu vực): Khu vực mà bạn muốn đặt dữ liệu tới vị trí đó, tùy vào đối tượng mà các
web, ứng dụng bạn muốn hướng tới thì chọn nơi phù hợp, ví dụ: Người dùng, khách hàng của
bạn chủ yếu là ở Việt Nam thì bạn nên chọn Singapore thì tốc độ truy xuất dữ liệu về VN sẽ
nhanh hơn những Region khác, ngược lại ở nước ngoài truy cập sẽ chậm hơn.
3. Copy settings from an existing bucket: Tính năng này giúp bạn copy những thông số cài đặt
đã được cấu hình từ bucket trước cho bucket mới.

Step 4:Set properties(Cấu hình tùy chọn) cho xô :


Chú thích :
 Versioning: Phiên bản cho phép bạn giữ nhiều phiên bản của một đối tượng trong một bucket.
 Server access logging: Nhật ký truy cập cho mỗi bản ghi.
 Tags: Báo cáo thanh toán và các dịch vụ đã sử dụng cho bucket.
 Object-level logging: Đăng nhập Dữ liệu và Sự kiện Quản lý cho Trails
 Default Encryption: Mã hóa Mặc định cho bucket.
 Cloud –Watch : Giám sát các chi phí yêu cầu trong xô
Step 5:
Set permissions(Tùy chọn phân quyền ):

Chú thích :
Quản lý chính sách xô công khai cho bucket: quản lý các chính sách public xô cho các user
Quản lý dach sách ACL : điều khiển truy cập cho các đối tượng .

Step 6:
Xem lại các cài đặt và tạo xô :
Trang chính xô hiển thị bucket đã được tao:

Step 7:
Tiếp theo để sử dụng bucket của bạn . Chọn vào các xô bạn đã tạo và muốn sử dụng .Trong giao
diện xô cho phép nhiều thao tác như : tải các đối tượng trong xô , thêm thẻ ,thay đổi siêu dữ
liệu,…
Để up dữ liệu lên xô đầu tiên cần tạo folder để chứa các đối tượng tải lên và phân loại danh mục

Step 8:
Click vào thư mục đã tạo  Chọn tải lên để up dữ liệu cần lưu trữ

Chọn dữ liệu cần up lên


Chọn xét quyền cho phép truy cập vào dữ liệu :
Chọn thuộc tính cho dạng lưu trữ : Ở đây là lúc quan trọng việc bạn chọn dạng lưu trữ như thế
nào để chi phí phát sinh phù hợp và phù hợp với mục đích sử dụng

Xem lại các cài đặt cho dữ liệu up lên và chọn tải lên
Dữ liệu đã được up lên

You might also like